Фа 






TETS В 








统计 学 


(第 三 版 ) 
(3) М. R. 斯 皮 格 尔 L. Ј. ЕЕЕ 
беж HAm WA BRE RGE 译 


m 
508 道 详细 解答 的 习题 






694 道 附加 习题 
< 一 
包括 几 百 道 习 题 的 计算 机 解 


一 
优秀 教科 书 的 有 和 丛 补 元 





ч 
目 学 的 民 师 益友 


ер) 4 * 版 社 
5 油麦 格 劳 - 希 尔 教 育 出 版 集团 


43; 








(0—1515.0101) 


责任 编辑 : 毕 M 


2 ВУНЕ 
超越 的 
-全美 经 典 学 可 指导 系列 
是 您 的 最 佳 
2] 18! 


AME Ж 1) ЕТЕУ 
ERA Pa K СН Л. ТЕ 
国内 重点 高 校 任 课 教师 全 力 推荐 并 担当 翻译 
省 时 前 效 的 学 习 辅 导 ， 人 全面 详 细 的 习题 解 从 
运 今 为 止 nl ТИЛИ ЯУ! 





全 美 经 


大 学 理工 科 下 业 


Asos 


系 D 





7 

概率 和 统计 2000 工 程 力学 习题 精 解 电气 工程 基础 
统计 学 工程 力学 工程 电磁 场 基础 
离散 数学 3000 物 理 习 题 精 解 数字 信号 处 理 

hematica 使 用 指南 流体 动力 学 数字 系统 导论 
数理 金融 引 论 物理 学 基础 数字 原理 
机 械 振动 材料 力学 电机 与 机 电学 
ЛУ tE 2000 离 散 数学 习题 精 解 基本 电路 分 析 
统计 学 原理 (E) 工程 热力 学 言 号 与 系统 
统计 学 原理 (Т) 数值 分 析 微生物 学 
微 积 分 量子 力学 生物 化 学 
静 力 学 与 材料 力学 有 机 化 学 习题 精 解 生物 学 
有 限 元 分 析 3000 化 学 习题 精 解 分 子 和 细胞 生物 学 
传 热学 大 学 化 学 习题 精 解 人 体 解剖 与 生理 学 
近代 物理 学 电路 


http://www.sciencep.com 


ISBN 7-03-009620-7 


|! 





| 


87030 09620 


http:/www.mheducation.com 


ISBN 7-03-009620-7/0 · 
E 价 : 35.00 元 





1915 








全 美 经 典 学 习 指 导 系列 


(第 三 版 ) 


[ 美 ]M. R. 斯 皮 格 尔 L.J. ХУ 


меж ETM RÈ RAA #&Ш 译 


A % k Жом 


麦 格 劳 - 希 尔 教育 出 版 集团 


2002 


内 ёл 
本 书 在 对 主要 的 数学 概念 进行 了 回顾 后 ,清晰 地 讲述 了 数学 和 其 他 科 
学 领域 都 会 需要 的 统计 学 的 基础 知识 , 从 变量 和 图 表 到 标准 分 布 再 到 基本 
的 概率 和 样本 理论 .介绍 了 用 最 流行 的 统计 软件 包 来 解决 问题 . 书 中 众多 的 
例题 及 详解 可 进一步 强化 对 理论 和 方法 的 理解 . 
本 书 可 供 大 学 数学 、 统 计 学 等 专业 的 教师 、 学 生 以 及 各 类 专业 技术 人 员 
55. 


Murray R. Spiegel, Larry J. Stephens, Ѕсһашт'ѕ Outline of Theory апа Prob- 


lems of Statistics, Third Edition. 


ISBN:0 – 07 – 060281 – 6 
Copyright © 1999 by the McGraw-Hill Companies, Inc. 


Authorized translation from the English language edition published by Mc- 
Graw-Hill Companies, Ine. 


All rights reserved. 


本 书 中 文 简 体 字 版 由 科学 出 版 社 和 美国 麦 格 劳 - 希 尔 教育 出 版 集团 合 
作出 版 .未 经 出 版 者 书面 许可 , 不 得 以 任何 方式 复制 或 抄袭 本 书 的 任何 部 
Л. 


版 权 所 有 ,翻印 必 究 . 


本 书 封面 贴 有 McGraw-Hill 公司 防伪 标签 ,无 标签 者 不 得 销售 . 
图 字 ;01 -- 2001 - 1767 号 


图 书 在 版 编目 (CIP) 数 据 


统计 学 (第 三 版 )/ [ 美 ] 斯 皮 格 尔 (Spiegel, М. R. ) 等 著 , 杨 纪 龙 等 译 , -k 
京 : 科 学 出 版 社 ,2002 

(全 美 经 典 学 习 指 导 系 列 ) 

ISBN 7 – 03 – 009620 -- 7 


I . 统 … 工 .四 斯 …@ 杨 … 本 .统计 学 N.C8 
中 国 版 本 图 书馆 CIP 数据 核 字 (2001) 第 047881 号 


A Z k Боз 出 版 
北京 东 黄 城 根 北 街 16 号 
邮政 编码 :100717 
http://www. sciencep.com 


AEPA 印刷 
科学 出 版 社 发 行 各 地 新 华 书店 经 销 


2002 年 1 月 第 一 版 开本 :A4(890x1240) 
2002 年 1 月 第 一 次 印刷 ”印张 :25 3/4 
印 数 ,1 一 5 000 字数 ;732 000 


定价 : 35.00 元 
(如 有 印 装 质量 问题 , 我 社 负责 调换 ( 环 伟 y) 


译 者 的 话 

本 书 是 美国 著名 统计 学 家 M.R. 斯 皮 格 尔 和 世 L. 本 .斯蒂芬 斯 所 著 的 一 本 统计 学 教材 , 系 《 全 
美 经 典 学 习 指 导 系 列 ) 从 书 之 一 .主要 内 容 有 频数 分 布 ,抽样 理论 ,估计 理论 ,假设 检验 ,方差 分 
析 , 回归 和 相关 分 析 , 时 间 序 列 分 析 及 过 程 统 计 控 制 等 . 

本 书 有 如 下 特色 :1. 阅读 本 书 所 需 的 数学 基础 仅 是 算术 和 初等 代数 学 的 知识 , 但 本 书 所 
收 内 容 在 深度 和 广度 上 都 超过 一 般 的 统计 学 初级 教程 .2. 书 中 附 有 大 量 的 已 给 出 详细 解答 的 
各 类 实际 应 用 问题 ,它们 占有 全 书 的 大 部 分 篇 幅 .3. 对 各 种 统计 方法 都 介绍 了 统计 软件 包 的 
使 用 .这 些 特 色 在 国内 的 统计 学 教材 中 尚 不 多 见 . 本 书 是 一 本 优秀 的 统计 学 教材 , 可 供 大 学 数 
学 、 统 计 学 等 专业 师 生 及 各 类 专业 技术 人 员 参 考 . 

参加 本 书 翻译 的 有 南京 师范 大 学 数学 与 计算 机 科学 学 院 的 杨 纪 龙 \、 杜 秀丽 、 姚 奕 . 赵 垦 媛 
和 梁 志 彬 .其 中 姚 奕 译 第 一 至 第 五 章 , 赵 媛 媛 译 第 六 至 第 十 章 , 染 志 彬 译 第 十 一 至 第 十 五 章 , 杜 
秀丽 译 第 十 六 至 第 十 九 章 , 杨 纪 龙 修改 整理 全 部 译 稿 .在 翻译 中 我 们 对 原著 中 的 若干 错误 作 了 
改正 ,不 在 书 中 一 一 指出 .由 于 时 间 仓 促 ,翻译 中 可 能 出 现 错误 ,欢迎 广大 读者 给 予 指正 . 

在 翻译 本 书 过 程 中 ,科学 出 版 社 的 毕 客 编辑 提出 了 许多 宝贵 的 建议 ,我 们 深 表 感谢 . 


译 者 
2001 年 10 月 


第 三 版 序言 


自从 1961 年 第 一 版 出 版 后 ,工业 技术 和 社会 科学 都 发 生 了 巨大 的 变化 ,在 第 三 版 中 我 们 
修改 了 过 时 的 内 容 . 例 如 ,在 第 二 版 中 的 无 线 电 真空 管 问 题 ,由 于 30 岁 以 下 的 人 大 多 不 知 无 线 
电 真 空 管 为 何 物 , 这 个 问题 以 及 许多 其 他 问题 已 经 换 为 诸如 健康 、 艾滋病、 英 特 网 技术 .电话 等 
问题 .数学 和 统计 学 的 面貌 没有 变 , 而 应 用 的 领域 以 及 统计 的 计算 方面 改变 了 . 

另 一 个 重要 的 改进 是 在 文中 对 统计 软件 进行 了 介绍 .SAS, SPSS 和 MINITAB 等 统计 软 
件 的 发 展 极 大 地 推动 了 统计 软件 在 现实 生活 问题 中 的 应 用 .MINITAB 软件 包 是 应 用 最 为 广 
泛 的 统计 软件 包 之 一 .我 要 感谢 Minitab Ine. 允许 我 在 本 书 中 使 用 MINITAB 的 产品 .如 今 许 
多 现代 统计 学 教科 书 都 把 计算 机 软件 作为 课本 内 容 的 一 部 分 , 我 之 所 以 选择 MINITAB, 是 因 
为 它 应 用 广泛 且 使 用 方便 .学 生 学 会 了 使 用 MINITAB 的 各 种 数据 文件 结构 和 命令 及 子 命令 
的 结构 ,也 就 能 使 用 别 的 统计 软件 了 .有 了 下 拉 式 菜单 和 对 话 方式 , 这 一 软件 使 用 就 变 得 更 方 
便 . 我 们 在 书 中 涉及 MINITAB 的 部 分 讨论 了 该 软件 的 各 种 命令 和 下 拉 菜 单 的 使 用 . 

本 书 许多 新 间 题 的 讨论 都 涉及 到 了 重要 的 统计 学 概念 一 一 p - 值 检 验 . 当 1961 年 第 一 版 
出 版 时 , 由 于 没有 计算 机 软件 的 辅助 , 它 的 应 用 远 不 如 今天 .如 今 P 一 值 的 计算 在 计算 机 软件 
中 只 是 平常 的 事 ,因此 它 已 经 由 统计 软件 包 相 应 提供 . 

第 一 版 中 的 第 十 九 章 “ 指 数 ” 已 由 新 的 一 章 “ 过 程 统 计 控 制 和 过 程 性 能 ”所 代替 .这 一 章 中 
讨论 的 许多 问题 都 在 工业 上 有 应 用 , 因此 我 觉得 有 必要 将 它们 引入 本 书 .统计 软件 包 中 介绍 的 
过 程 统 计 控 制 和 过 程 性 能 的 技术 为 把 这 些 技 术 应 用 到 许多 工业 背景 中 去 提供 了 方便 .软件 完 
成 了 所 有 的 计算 工作 , 这 些 计算 相当 繁琐 .我 选择 使 用 MINITAB 是 因为 我 觉得 它 在 SPC 应 用 
中 是 最 好 的 . 

我 要 感谢 我 的 妻子 Lan 对 我 工作 的 理解 , 感谢 我 的 朋友 Stanley Wileman 在 计算 机 方面 
给 我 提供 的 帮助 ,还 有 Alan Hunt 和 英国 伦敦 Keyword 出 版 有 限 公司 的 所 有 工作 人 员 , 感 谢 他 
们 的 杰出 工作 .最 后 , 我 要 感谢 McGraw-Hill 工作 人 员 的 合作 和 帮助 . 


L. J. WEAR 


第 二 版 序言 


统计 或 者 说 统计 方法 ,在 人 类 几乎 所 有 的 活动 领域 中 扮演 着 越 来 越 重 要 的 角色 .原来 因 处 
理 国家 事务 而 得 名 的 统计 , 现在 已 影响 到 农业 .生物 、 商业 、 化 工 . 通 信 、 经 济 、 教 育 、 电 子 、 医 药 、 
物理 、 政 治学 、 心 理学、 社会 学 以 及 许多 其 他 科学 和 工程 领域 . 

本 书 旨 在 介绍 一 般 的 统计 学 原理 , 这些 原 理 可 能 对 所 有 人 都 会 有 所 帮助 , 而 不 管 他 们 专门 
研究 哪个 方面 .本 书 可 作为 所 有 现行 标准 教材 的 补充 , 还 可 作为 统计 学 的 正规 教材 .对 于 那些 
正在 致力 于 把 统计 应 用 到 他 们 所 研究 的 领域 中 的 人 , 本 书 也 应 有 相当 大 的 帮助 . 

本 书 每 章 开 始 都 用 图 例 和 其 他 描述 性 材料 清楚 地 阐述 了 有 关 的 定义 、 定 理 和 法 则 , 然后 分 
类 给 出 已 给 解答 的 和 补充 的 问题 ,这 些 间 题 大 多 来 自 实际 应 用 .其 中 已 经 给 出 解答 的 问题 可 以 
阐明 原理 , 增强 读者 对 本 书 的 理解 .这 些 问 题 突出 了 一 些 重 点 原理 , 使 得 学 生 不 会 在 学 习 过 程 
中 感到 没有 依据 .这 些 问 题 还 不 断 重 复 了 对 教学 效率 至 关 重 要 的 基本 原则 , 包括 许多 公式 的 衍 
生 式 .大量 的 附 答案 的 补充 问题 ,可 以 使 学 习 者 对 每 章 所 学 的 内 容 进行 全 面 的 复习 . 

理解 本 书 仅 需 的 数学 背景 是 算术 和 代数 学 的 知识 .本 书 第 一 章 复习 了 重要 的 数学 概念 , 这 
一 章 既 可 以 在 课程 开始 的 时 候 学 习 , 也 可 以 在 今后 需要 时 学 习 和 参考 . 

本 书 的 前 几 章 涉 及 的 问题 是 频数 分 布 和 相关 的 中 心 趋势 . 离 差 、 偏 度 和 峰 度 .然后 导入 对 
基本 概率 原理 和 应 用 的 讨论 ,为 学 习 抽 样 理论 做 好 铺垫 .抽样 理论 首先 涉及 与 正 态 分 布 相关 的 
大 样本 理论 、 统 计 估计 和 假设 检验 及 显著 性 问题 . 其 后 一 章 讨论 与 小 样本 理论 相关 的 学 生 氏 : 
分 布 , x* 分 布 ,下 分 布 及 应 用 .曲线 拟 合 和 最 小 二 乘法 这 一 章 介 绍 了 与 两 个 变量 有 关 的 相关 性 
和 回归 问题 .其 后 的 章节 涉及 到 方差 分 析 和 非 参数 方法 ,这 两 个 问题 都 是 第 一 次 在 第 二 版 中 谈 
到 .最 后 两 章 分 别 讨 论 了 时 间 序 列 分 析 和 指数 问题 . 

本 书 所 收 内 容 比 大 多 数 初级 课程 涉及 的 内 容 多 得 多 ,这样 使 用 起 来 也 就 更 灵活 , 既 可 以 是 
一 本 很 有 用 的 参考 书 , 也 可 以 激发 读者 对 本 书 讨论 的 问题 产生 更 大 的 兴趣 .使 用 本 书 时 , 可 以 
不 必 按 其 编排 的 顺序 学 习 , 其 至 可 以 略 过 某 些 章节 而 不 会 给 读者 带 来 任何 困难 .例如 ,如果 希 
望 在 学 习 抽 样 理 论 前 , 先 学 习 相 关 分 析 , 回归 分 析 , 时 间 序 列 和 指数 问题 , 可 以 在 第 五 章 之 后 直 
接 学 习 第 十 三 到 第 十 五 章 和 第 十 八 到 第 十 九 章 .类似 地 ,如 果 不 想 花 太 多 的 时 间 学 习 概率 , 可 
以 省 略 第 六 章 的 大 部 分 内 容 作 为 基础 课程 , 第 十 五 章 的 所 有 内 容 可 以 不 学 .我 们 按照 现在 的 顺 
序 编排 本 书 , 是 因为 在 现代 课程 中 , 越 来 越 趋 向 于 尽早 介绍 抽样 理论 和 统计 影响 的 问题 . 

我 要 感谢 很 多 政府 和 私人 的 机 构 为 本 书 的 表格 提供 数据 ,为 此 ,全 书 表 格 中 的 数据 都 注 明 
了 其 来 源 .在 此 , 我 要 特别 感谢 英国 皇家 学 会 会 员 剑 桥 大 学 教授 Ronald A. Fisher HE H4 
家 学 会 会 员 洛桑 (Rothamsted) 的 Frank Yates 博士 和 爱丁堡 的 Messrs. Oliver and Boyd Ltd 公 
司 , 感 谢 他们 允许 本 书 使 用 《生物 、 农 业 和 医药 研究 统计 用 表 》 一 书 中 表格 3 的 数据 .我 还 要 感 
谢 Esther 和 Meyer Scher 的 鼓励 以 及 McGraw-Hill 公司 工作 人 员 的 合作 . 


M. R. 斯 皮 格 尔 
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第 一 章 变量 和 国 形 


统计 学 


统计 学 是 一 门 关于 用 科学 方法 收集 整理. 汇总、 描述 和 分 析 数 据 资料 ,并 在 此 基础 上 进行 
推断 和 决策 的 科学 . 

狭义 地 说 ,统计 这 个 术语 被 用 来 统 指 数据 或 从 数据 中 得 到 的 一 些 数字 , 比如 平均 数 .因此 ， 
我 们 常 提 到 职业 统计 , 事故 统计 等 . 


总 体 和 样本 , 归纳 统计 学 和 描述 性 统计 学 


在 收集 一 组 反映 人 或 物 的 特征 的 数据 时 , 比如 一 所 大 学 学 生 的 身高 和 体重 , 一 个 工厂 某 天 
生产 的 螺栓 的 次 品 和 正品 数 ,观察 整 组 是 不 可 能 也 是 不 切实 际 的 , 特别 是 当 整 组 容量 很 大 的 时 
候 . 常 用 的 方法 是 观测 这 个 组 中 的 一 个 部 分 一 一 样本 , 而 不 是 观测 整个 组 一 一 总 体 . 

一 个 总 体 可 以 由 有 限 个 元 素 或 无 限 个 元 素 组 成 .例如 , 将 一 个 工厂 某 天 生产 的 螺栓 视 为 一 
个 总 体 , 那么 它 是 有 限 的 ;而 将 一 枚 硬币 连续 抛掷 得 到 的 所 有 结果 (正面 反面) 视 为 一 个 总 体 ， 
那么 它 是 无 限 的 . 

如 果 样 本 能 很 好 地 反映 总 体 特 性 , 那么 就 可 以 通过 对 样本 的 分 析 来 给 总 体 下 结论 , 在 这 种 
情况 下 进行 的 统计 工作 称 为 归纳 统计 学 或 统计 推断 .由 于 这 样 的 推断 不 能 绝对 肯定 ,因此 在 下 
结论 时 常常 用 到 概率 这 一 概念 .如 果 仅仅 只 是 描述 和 分 析 特 定 的 对 象 而 不 下 结论 或 对 较 大 的 
群体 不 进行 推断 , 在 这 种 情况 下 进行 的 统计 工作 称 为 描述 性 统计 学 或 演绎 统计 学 . 

在 学 习 统 计 学 之 前 , 我们 先 来 复习 一 些 重 要 的 数学 概念 . 


离散 变量 和 连续 变量 


一 个 变量 用 一 个 符号 表示 ,如 X, Y, H, x 或 B. 变 量 的 值 域 是 指 变量 的 一 切 可 能 取 值 的 
集合 .如 果 一 个 变量 仅 能 取 一 个 值 , 那么 这 个 变量 称 为 常量 . 

一 个 理论 上 可 以 取 2 个 给 定 值 之 闻 任 意 值 的 变量 称 为 连续 变量 .反之 , 则 称 为 离散 变量 

例 1 一 个 家 庭 中 儿童 人 数 N 可 取 0,1,2,3,… 中 任意 值 ,但 N 不 能 是 2.5 或 3.842, 因 
此 М 是 一 个 离散 变量 . 

例 2 一 个 人 的 身高 H, 根据 测量 的 精度 , 可 以 是 62 英寸 ), 63.8 英寸 或 65.8341 英寸， 
Н 是 一 个 连续 变量 . 

可 以 用 离散 变量 或 连续 变量 来 描述 的 数据 分 别 被 称 为 离散 数据 或 连续 数据 . 例如 , 每 
1000 个 家 庭 中 儿童 数量 就 是 一 组 离散 数据 , 而 100 个 大 学 生 的 身高 就 是 一 组 连续 数据 .通常 
测量 产生 连续 数据 , 而 枚 举 或 计数 产生 离散 数据 . 

有 时 我 们 还 需 将 变量 概念 扩展 到 非 数字 化 实体 .例如 , 彩虹 的 颜色 C 就 是 一 个 变量 , 它 可 
取 ”* 值 "为 红 \ 橙 、 黄 、 绿 、 蓝 . 青 和 紫 . 通 常 可 以 用 数值 量化 这 样 的 变量 , 比如 用 1 表示 红色 ,用 2 
表示 橙色 等 等 . 


数据 侈 人 
由 于 72.8 到 73 的 距离 较 它 到 72 的 距离 近 , 这 是 因此 伟人 入 72.8 的 结果 为 73 同样 ， 
72.8146 舍 入 至 最 近 的 百 分 位 (或 小 数 点 后 2 位 ) 即 是 72. 81, 这 是 因为 72.8146 距 72.81 较 


1) 1 英寸 =0.0254 Ж. 


72.82 近 些 . 

在 把 72.465 舍 入 至 最 近 的 百 分 位 时 ,我 们 发 现 72.465 IE 72.48 和 距 72.47 恰好 一 样 远 . 
在 实践 中 对 于 这 样 的 情况 ,常常 是 把 $ 伟人 后 得 到 偶数 .因此 72.465 & А 272.46, 183.575 
舍 入 至 183.58, 116 500 000 舍 入 至 最 近 的 百 万 位 就 是 116 000 000. 这 样 做 的 好 处 就 是 在 大 量 
的 运 拭 中 , 可 以 使 累积 舍 人 误差 达到 最 小 (见习 题 1.4). 


科学 记 数 
在 书写 数字 时 , 特别 是 磁 到 那些 小 数 点 前 后 有 许多 零 的 数 , 我 们 用 科学 记 数 法 就 方便 多 


例 3 10 =10,102=10x10=100,10=10x10x10x10x10=100000， 
10° = 100 000 000. 

例 4 10°=1;107t=.1 R 0.1;107?=.01 3 0.01;1075= .00001 或 0.00001. 

|5 864 000 000 =8.64 x 108,0. 00003416 =3.416x 105. 

例如 ,一 个 数 乘 以 10°, 相当 于 把 小 数 点 向 右 移动 8 个 位 置 , 而 一 个 数 乘 以 10-5 相 当 于 把 
小 数 点 向 左 移动 6 个 位 置 . 

我 们 通常 写 0.1253 而 不 写 .1253 是 为 了 强调 小 数 点 前 的 数字 没有 被 谣 忽 , 而 在 不 产生 混 
消 的 情况 下 , 如 在 表格 里 ,小 数 点 前 的 0 可 以 省 略 . 

通常 我 们 用 圆 括 号 或 点 来 表示 2 个 或 更 多 的 数 相 乘 .例如 :($)(3) =5.3=5x3=15， 
(10)(10)(10)=10:10:10= 10x10x10=1000. 当 字母 用 来 表示 数字 时 , 圆 括号 或 点 可 以 省 
上 略 , 比 好 ;ab = (а) (Б) =а:ф=ахь. 

科学 记 数 法 常常 用 在 计算 当中 ,特别 是 在 对 小 数 点 的 定位 中 ,我们 可 以 采用 如 下 规则 . 

10? . 10° = 102+9， 10° _ 102-。 


其 中 请 和 9 是 任意 数字 . 
在 10° 中 , p 称 为 指数 , 而 10 称 为 底数 . 


例 6 10° х 10? = 1000 х 100 = 100 000= 105, 即 102*?; 
10 _1 000 000 _ 9 6-4 
10i 10 000 = 100 = 10°, Вр 10674, 


例 7 4 000 000x 0. 0000000002 = (4х 106) x (2x10-1)=4x2x10x10-10 
=8x 10° 19 =8x 107? = 0.0008 
例 8 2-006 x80 000_ 6x10 “x8x10* 48х10! 
0.04 4x107? 4x107? 
=12x10=12 000 





_ 48 1-(-2) 
= 4 х 10 


有 效 数 字 


如 末 一 个 人 的 身高 被 精确 地 记录 为 65.4 英寸 ， 这 就 意味 着 这 个 人 的 真实 身高 介 于 65.35 
RFH 65.45 英寸 之 间 . 这些 精确 的 数字 ， 除去 那些 小 数 点 定位 所 需 的 零 , 被 称 为 数 的 有 效 数 
F. 

По 65.4 有 3 个 有 效 数字 . 

例 10 4.5300 有 5 个 有 效 数字 . 

例 11 .0018=0.0018=1.8x10-3 有 2 个 有 效 数字 . 

例 12 .001800=0.001800=1.800x10-3 有 4 个 有 效 数字 

枚 党 (或 计数 ) 而 非 测 量 得 到 的 数 是 准确 的 ,并且 有 无 限 多 个 有 效 数字 然而 在 某 些 情况 
下 ,如 采 没 有 更 多 信息 很 难 决定 哪些 数字 是 有 效 的 ,例如 , 数字 186 000 000 可 能 有 3,4,…,9 
个 有 效 数字 .如 果 认 为 它 有 5 个 有 效 数字 ,那么 把 它 记 为 186 .00x 106 或 1.8600 x 108 2 ж. 


数值 计算 


在 进行 包括 乘 . 除 以 及 开 方 运算 时 , 最 终结 果 的 有 效 数 字 个 数 不 可 能 比 运 邹 数 中 有 效 数 字 
个 数 最 少 的 数 的 有 效 数字 个 数 多 (见习 题 1.9). 

例 13 73.24x4.52=331. 

例 14 1.648/0.023= 72. 

例 15 V38.7=6.22. 

例 16 8.416 X50=420.8( 如 果 50 是 准确 的 ). 

在 进行 数 的 加 、 减 运算 时 ,最终 结果 的 小 数 点 以 后 的 有 效 数字 个 数 不 可 能 比 运算 数字 小 数 
点 以 后 的 最 少 有 效 数字 个 数 多 ( 见习 题 1.10). 

例 17 3.16+2.7=5.9. 

例 18 83.42-72=11. 

例 19 47.816-2S$=22.816( 如 果 25 是 准确 的 ). 

以 上 对 加 法 ,减法 的 法 则 可 以 推广 (见习 题 1.11). 


函数 


看 对 于 变量 X 的 每 个 值 ,变量 Y 都 有 一 个 或 更 多 的 值 与 之 对 应 , ШИ Y 是 一 个 关于 X 
的 函数 ,并 记 为 Y= F(X)( 读 作 “Y 等 于 F(X)”). 下 也 可 用 其 他 字母 (G, с 等 ) 来 代替 . 

变量 X 称 为 自 变量 , Y 称 为 因 变 量 . 

在 对 于 X 的 每 一 个 值 , Y 有 且 仅 有 一 个 值 与 之 对 应 , 则 称 Y 为 X 的 单 值 函数 ; 否则, 称 
Y 为 X 的 多 值 函 数 . 

例 20 美国 的 总 人 口 数 忆 是 时 间 * 的 函数 , 记 作 Р =F). 

#21 坚 直 悬挂 的 弹 管 受到 的 拉力 S 是 挂 在 它 末端 的 重量 W 的 函数 , 记 作 ; S = 
G(W). 

变量 则 的 跑 数 关系 常常 用 表 来 描述 .然而 , 它 也 可 以 用 关于 变量 的 方程 来 表示 ,如 Y= 
2X -3, 在 这 个 方程 中 ,根据 不 同 的 XX 的 值 , 就 可 以 得 到 相应 的 Y 的 值 . 

车 Y= F(X), 则 下 (3) 表 示 “ 当 X=3 时, Y 18°; Е(10) 78“ Х=10 时 , Y 的 值 " 等 
等 .因此 如 果 Y= F(X)=X?*, 那 么 F(3)=3?=9, 就 是 当 义 =3 时 YY 的 值 . 

РЁ ЖОН) ЕД Н БАЕ Г ЗП 2 个 或 更 多 个 变量 (见习 题 1.17). 


直角 坐标 


考虑 两 条 相互 垂直 的 带 有 适当 刻度 的 直线 XOX 和 YOY, 分 别称 为 X 轴 和 YY 轴 ( 见 图 


П І 
(2.3.4.5) ® я = п в а 
{ 





1-1) .整个 平面 被 这 两 条 直线 分 割 成 4 个 部 分 ,分 别 用 工 , П, ШНМ Ж К, MAR BL, 
第 二 和 第 四 象限 , 整个 平面 称 为 XY 平面 . 

О 点 称 为 原点 或 零点 .过 任意 给 定 的 一 点 忆 , 回 X 轴 和 Y 轴 分 别 作 垂 线 . 垂 线 与 ХОН] 
交点 值 X 和 与 Y 轴 的 交点 值 Y 称 为 P 点 的 直角 坐标 , 或 简称 为 坐标 , 记 为 (X,Y).X 称 为 点 
的 横 坐 标 , Y 称 为 点 的 纵 坐标 .在 图 1-1 F, P 点 的 横 坐 标 是 2, 纵 坐 标 是 3, P 点 的 坐标 记 为 
(2,3). 

相反 地 ,给 定 了 点 的 坐标 ,我 们 就 可 以 对 这 个 点 定位 或 作 图 .在 图 1-1 中, Q,R 和 S 分 别 
表示 坐标 为 (-4, 一 3), (一 2.3,4.5) 和 (3.5, 一 4) 的 点 . 

过 О 点 作 2Z 轴 垂 直 于 XY 平面 ,我 们 可 以 很 容易 地 推广 以 上 的 概念 到 三 维 空间 . 在 这 种 
情况 下 ,点 P 的 坐标 应 为 (X,Y, Z). 


图 形 


变量 则 的 关系 也 可 用 图 形 来 表示 .根据 数据 的 性 质 和 应 用 图 形 的 目的 , 有 许多 种 类 的 图 形 
已 在 统计 学 中 得 到 使 用 .这 其 中 有 条 形 图 、 圆 形 图 、 像 形 图 等 . 这些 图 形 也 常 称 为 图 表 , 例如 条 
KAR, 圆 形 图 表 等 (见习 题 1.23,1.24,1.26 和 1.27). 


ЛЕ 


方程 是 形 如 A = В 的 表达 式 ,其 中 A 称 为 方程 的 左 端 ( 边 ), в 称 为 方程 的 右 端 ( 边 ) .只 
我 们 对 方程 的 两 边 进行 相同 运算 ,我们 就 能 得 到 等 价 方程 . 因此 我 们 对 方程 的 两 边 同 时 加 上 、 
减 去 、 乘 以 或 除 以 同一 个 值 , 我 们 就 能 得 到 一 个 等 价 方程 .要 注意 的 是 除 以 0 是 不 允许 的 

例 22 对 于 方程 2X+3=9, 从 两 边 同时 减 去 3,2X+3-3=9-3 得 2X=6. 两 边 同 时 除 
以 2,2X/2=6/2, 得 X=3. 这 个 值 就 是 给 定 方程 的 解 .用 3 来 代替 X, 得 2x3+3=9 即 9= 9， 
这 是 一 个 恒等式. 求 方程 解 的 过 程 称 为 解 方 程 . 

上 述 方法 可 以 解 含有 2 个 未 知 数 的 2 个 方程 ,含有 3 个 未 知 数 的 3 个 方程 等 等 这样 的 一 
组 方程 称 为 联 立方 程 (见习 题 1.30). 


不 等 式 


从 号 “<” 和 “ >” 分别 表示 “小 于 "和 “大 于 ”. 符号 “之 "和 “ 实 ” 则 分 别 表示 “ 小 于 等 于 ”和 “大 
于 等 于 ". 众 所 周知 ,这 些 都 是 不 等 号 . 

例 23 3<5 读 作 “3 小 于 5”. 

例 24 5>3 读 作 “5 大 于 3”. 

例 25 X<8 读 作 “X 小 于 8”. 

例 26 Х>101#{Е“Х 大 于 等 于 10”. 

例 27 4<Y<6 读 作 “4 小 于 Y,Y 小 于 等 于 6" 或 “Y 在 4 和 6 之 间 , 不 包括 4, 而 包括 
6 ,或 “Y 大 于 4 且 小 于 等 于 6”. 

有 不 等 号 连接 的 关系 式 称 为 不 等 式 . 与 等 式 的 两 边 一 样 ， 我 们 也 称 不 等 式 的 两 边 为 不 等 式 
Вз, 因此 在 不 等 式 4< Y<6 中 ,4, Ү 和 6 是 不 等 式 的 各 端 . 

在 下 列 情况 下 ,不 等 式 依然 成 立 . 

1 .不 等 式 各 端 同时 加 上 或 碱 去 相同 的 数 . 

例 28 由 于 15>12, 因 此 15+3>12+3( 即 18>15) 和 15-3212 -3(8 12>9). 

2. 不 等 号 各 端 同时 乘 以 或 除 以 相同 的 正 数 . 

例 29 由 于 15>12, 因 此 15x3>12x3( 即 45>>36) 和 15/3>12/3( 即 5S>4). 

3. 不等式 各 端 同 时 乘 以 或 除 以 相同 的 负数 , 不 等 号 的 方向 要 改变 

例 30 由 于 15>12, 因 此 15x(-3)<12x (-3)( 即 -4$< – 36) 15/(-3)>12/(- 
3)( 即 一 S$< - 4). 


对 数 


每 个 正 数 N 都 可 以 表示 为 10 的 宕 的 形式 , 也 就 是 说 ,我 们 总 可 以 找到 p, 使 得 N = 10°, 
р 称 为 以 10 为 底 的 N 的 对 数 或 N 的 常用 对 数 , 记 为 p =logioN, 或 简 记 为 p =logN .例如 ,由 
于 1000=10 ,因此 log1000=3. 同 样 地 ,由 于 0.01=10-2, 因 此 log0.01= ~ 2. 

当 NN 是 1 到 10( 即 10? 到 10:) 之 间 的 数 时 ,=logN 是 0 到 1 之 间 的 数 , 并 可 以 在 附录 荆 
中 查找 . 

例 31 在 附录 证 中 查找 iog2.36, 顺 着 标 有 N 的 左 列 向 下 看 , 直到 我 们 找到 第 一 个 2 位 数 
23, 然 后 我 们 向 右 直 到 看 到 标 有 6 的 列 , 就 找到 了 表 值 3729. 因此 log2. 36 = 0. 3729( 即 
2.36 = 109-3729), 

所 有 正 数 的 对 数 都 可 以 从 1 到 10 的 对 数 中 得 到 . 

例 32 在 例 31 中 ,2.36=10%””3, 用 10 连续 地 去 乘 , 得 到 23.6= 1013729,236 = 102-3729, 
2360= 10 ”等 等 .因此 log2. 36 = 0. 3729, log23.6 = 1. 3729, log236 = 2. 3729, log2360 = 
3.3729. 

例 33 由 于 2.36=10'` ,我们 连续 地 用 10 去 除 得 到 0.236 = 109272971 = 1070670, 
0236 = 100.3729-2 = 101-6271, 以 此 类 推 . 

通常 我 们 把 0.3729 - 1 写 为 9.3729 - 10 或 1.3729;0.3729 - 2 写 为 8.3729-10 或 2 
3729, 以 此 类 推 . 有 了 这 些 记号 ,我 们 有 


1060.236 = 9.3729 – 10=1.3729 = — 0.6271 
log0. 0236 =8.3729-10=2.3729= -1.6271 


以 此 类 推 . 

小 数 部 分 .3729 在 这 些 算法 中 称 为 对 数 的 尾数 .在 尾数 小 数 点 前 的 部 分 ,[ 即 1,2,3,1,2 
(或 9-10,8- 10)] 称 为 首 数 . 

以 下 法 则 很 容易 证 明 ， 

1. 大 于 1 的 数 , 它 的 首 数 是 非 负 的 , 并 且 首 数 比 小 数 点 前 的 数 的 位 数 小 . 

例 34 2360, 236, 23.6 和 2.36 的 对 数 的 首 数 分 别 为 3,2,1 和 0, 而 得 到 的 对 数 分 别 为 
3.3729,2.3729,1.3729 # 0.3729. 

2. 小 于 1 的 数 , 它 的 首 数 是 负 的 ,并 且 首 数 的 绝对 值 比 紧 跟着 小 数 点 后 的 零 的 个 数 大 

例 35 0. 236, 0. 0236 和 0. 00236 的 首 数 分 别 为 - 1, – 2, – 3, 而 求 得 的 对 数 分 别 为 
1.3729,2.3729 和 3.3729 或 9.3729--10,8.3729-10 和 7.3729-10 

如 采 要 算 4 个 数字 数 的 对 数 , 比如 2.364 和 758.2, 可 以 用 插值 法 求解 (见习 题 1.36). 


反对 数 


在 指数 形式 2.36 = 1093729, 2.36 称 为 0.3729 的 反对 数 .2.36 的 对 数 是 0.3729, 接 下 来 
就 可 以 得 到 
antilog1.3729 = 23.6, antilog2.3729 = 236, antilog3. 3729 = 2360 
antilog9. 3729 — 10 = antilog 1.3729 = 0.236 
antilog8.3729 - 10 = antilog 2.3729 = 0.0236 
任何 数 的 反对 数 都 可 通过 附录 而 查找 ， 
例 36 ЖС antilog8.6284 — 10, 在 表 中 寻找 尾数 0.6284 它 所 处 的 行 标号 为 42, 而 列 标号 
为 35, 所 以 所 求 的 数 为 425. 由 于 首 数 为 8 - 10, 因此 所 求 的 结果 是 0. 0425. 同样 地 , antilog 
3.6284 = 4250, antilog5. 6284 = 425 000. 
Е У АЕ ЕК, ЯЕ рр Е НА ЕО 见习 题 1.37). 


对 数 计 算 


对 数 计算 这 循 下 列 法 则 、 
log MN = logM + logN 


log ~ = logM - logN 


logM? = plogM 





P Y 

根据 这 些 结论 ,log А6 = plogA + glogB + rlogC – slogD – tlogE ( BL 23 011.38 ~1.45). 
习题 及 解答 

变量 


1.1 说 出 下 列 哪些 是 离散 数据 , 哪些 是 连续 数据 : 
(a) 股 票 市 场 每 天 抛售 的 股票 数 ; 
(b) 气 象 局 每 隔 半 个 小 时 记录 的 气温 ; 
《c) 某 公司 生产 的 电视 显像管 的 寿命 ; 
(d) 大 学 教授 的 年 收入 ; 
(e) 某 工厂 生产 的 1000 个 螺栓 的 长 度 . 
АЕ EF (a) 离 散 数据 ;(b) 连 续 数 据 ;(c) 连 续 数据 ;(d) 离 散 数据 ;(e) 连 续 数据 . 
1.2 给 出 下 列 变 基 的 值 域 , 并 说 出 哪些 是 连续 变量 , 哪些 是 离散 变量 ， 
(a) 一 台 洗 衣 机 里 水 的 加 仑 数 С; 
(b) 一 书架 上 书 的 数目 B; 
(c) 撕 一 对 角子 所 得 的 点 数 之 和 S; 
(d) 一 个 球 的 直径 Р; 
(e) 欧 洲 的 国家 С. 
解 EF (a) 值 域 : 从 0 到 洗衣 机 容量 之 间 的 任意 值 . G 是 连续 变量 . 
(b) 值 域 :0,1,2,3,… 直 到 书架 上 最 多 能 放置 的 书 的 数目 . B 是 离散 变量 . 
(co) 值 域 :一 个 角子 上 的 点 数 可 以 是 1,2,3,4,5 或 6. 因 此 毛 一 对 钥 子 所 得 的 点 数 之 和 S 可 以 为 2,3, 4， 
5,6,7,8,9,10,11 或 12. S 是 离散 变量 . 
(d) 值 域 :如 果 我 们 把 一 点 视 为 直径 是 0 的 球 , 那么 р 的 值 域 为 大 于 等 于 0 的 一 切实 数 р 是 连续 变 
Ж. 
(e) 值 域 :C 可 以 为 英国 .法 国 、 德 国 等 , 可 分 别 用 1, 2, 3 等 来 表示 . C 是 离散 变量 ， 


数据 伟人 


1.3 按 要 求 售 和 人 下列 数据 : 
(a)48.6 ”伟人 至 最 近 的 整数 ; ({)143.95 侈 入 至 最 近 的 十 分 位 数 ， 
(Ь)136.5 舍 入 至 最 近 的 整数 ; (g)368 FARRUH AMA; 
(c)2.484 ”省 入 至 最 近 的 百 分 位 数 ;，(h)24 448 侈 入 至 最 近 的 干 位 数 ， 
(4)0.0435 舍 入 至 最 近 的 千 分 位 数 ; (1)5.56500 含 入 至 最 近 的 百 分 位 数 ， 
(е)4.50001 舍 入 至 最 近 的 整数 ， (j)5.56501 舍 入 至 最 近 的 百 分 位 数 . 
解 EE (а)49; (b)136; (c)2.48; (4)0.044; (е)5; (f)144.0; (g)400; (h)24 000; 
(1)5.56; (j)5.57. 

1.4 按 要 求 对 4.35, 8.65, 2.95, 12.45, 6. 65,7.55 和 9.75 ЛЖ. (a) 直 接 加 ; REE 
数 " 原 则 舍 入 至 最 近 的 十 分 位 数 ;(c) 遇 5 向 前 进 . 


# кє (а) 4.35 (Ъ) 4.4 (0) 4.4 


8.65 8.6 8.7 
2.95 3.0 3.0 
12.45 12.4 12.5 
6.65 6.6 6.7 
7.55 7.6 7.6 
9.75 9.8 9.8 
总 和 52.35 总 和 52.4 总 和 52.7 
注意 ,过 程 (b) 的 累积 会 人 误 浆 最 小 , 因此 过 程 (b) 优 于 过 程 (c). 
科学 记 数 和 有 效 数 字 


1.5 下 列 数 字 若 不 用 10 的 竹 次 方 表示 各 为 多 少 . 
(a)4.823 x 107; (с)3.80 х 107‘; (е)300 х 10°; 
(b)8.4x 1076; (d)1.86 x105; (£)70 000x 107". 
E F (a) 把 小 数 点 向 右 移 7 个 位 置 , 得 到 48 230 000; 
(b) 把 小 数 点 向 左 移 6 个 位 置 , 得 到 0.0000084; 
(с)0.000380;(4)186 000; 
(e)30 000 000 000; (£)0. 0000070000. 

1.6 假定 下 列 数 是 精确 记录 的 , 每 个 数 有 几 个 有 效 数 字 ? 
(а)149.8 英寸 ; (d)0.00280 Ж; (g)9 所 房子 ; 
(b)149.80 35; (е)1.00280 Ж; (h)4.0 х 1038; 
(с)0.0028 Ж; (0)9 ж; (1)7.58400 х 10-Х. 
解 EE (а)4; (Ь)5;(с)2;(4)3; (е)6; (001; (g) ÆR; (h)2;(i)6. 

1.7 假定 以 下 测量 值 是 精确 记录 的 , 每 个 测量 值 的 最 大 误差 是 多 少 ? 
(а)73.854 英寸 ;(b)0.09800 立方 英尺 ;(c)3.867 x108 公里 . 


解 ”& 和 (a) 此 测量 值 可 以 从 73.8535 到 73.8545 英寸 取 值 , 因此 最 大 误差 是 0_0005 英寸 .共有 5 个 
有 效 数字 . 


(b) 此 测量 值 可 以 从 0.097995 到 0.098005 立方 英尺 取 值 , 因此 最 大 误差 是 0 000005 立方 英尺 .共有 4 
个 有 效 数字 . 


(c) 准 确 的 公里 数 大 于 3.8665 x 108 而 小 于 3. 8675 x 108, 因此 最 大 误差 是 0.0005 x 108 或 50 000 公 
里 .共有 4 个 有 效 数字 . 

1.8 用 科学 记 数 法 书写 下 列 数字 (除非 另外 说 明 , 否则 认为 所 有 数据 是 精确 记录 的 》 
(а)24 380 000(4 个 有 效 数 字 ); (b)0.0000098S1; (с)7 300 000 000(5 个 有 效 数 字 ); 
(d) 0.00018400. 


解 ES (a)2.438x107; (b)9.851x 10-6， (с)7.3000 х 10°; (4)1.8400 x 1074. 
数值 计算 


1.9 证 明 如 果 假 设 5.74 和 3.8 分别 有 3 个 和 2 个 有 效 数字 , 那么 它们 的 乘积 不 能 精确 到 多 
于 两 个 有 效 数字 . 


解 БЕ 解法 一 5.74x3.8=21.812, 但 并 不 是 积 J 所 有 数字 都 是 有 效 数字 .由 于 5.74 代表 了 
5.735 到 5.745 之 间 的 任何 数 .而 3.8 代表 了 3.75 到 3.85 之 间 的 任何 数 ,因此 5.74 和 3.8 的 积 的 最 小 
可 能 值 为 5.735 x 3.75 = 21.50625, 最 大 可 能 值 为 5.745 x 3.85=22 11825. 

由 于 积 的 可 能 范围 从 21.50625 到 22.11825, 因此 最 多 只 有 积 的 前 两 个 数 是 有 效 的 , 结果 应 为 22. 
数字 22 代表 了 从 21.5 到 22.5 之 间 的 任何 数 . 


1.10 


1.12 


解法 二 НРУ КЕ T, Е пр ТО: 
5.7 4 
3.8 
4592 
1722 
21.812 
在 答案 里 不 应 有 多 余 一 个 的 怀疑 数字 , 因此 取 2 个 有 效 数字 22 .注意 ,在 运算 中 , 没有 必要 运算 比 数据 
中 小 数 点 后 最 小 有 效 数 字 个 数 更 多 的 有 效 数 字 , 因 此 如 果 5.74 伟人 到 5.7, 积 为 5.7x3.8=21.66= 
22, 有 两 个 有 效 数 字 , 与 上 述 结果 一 样 . 
如 果 不 用 电脑 计算 ,那么 在 计算 中 不 需要 保留 比 小 数 点 后 最 小 有 效 数字 个 数 多 于 一 个 或 两 个 的 有 
效 数 字 , 并 把 最 终 答案 舍 入 至 适当 的 数 .用 计算 机 计算 时 , 它 能 提供 许多 位 数字 , 我 们 必须 注意 并 不 是 
所 有 数字 都 是 有 效 的 . 
假设 所 有 数字 是 有 效 的 ,对 4.19355, 15.28, 5.9561, 12.3 和 8.472 做 加 法 . 


E S (a) 在 做 加 法 运算 中 ,用 斜体 字 表 示 疑 问 数字 .不 超过 一 个 疑问 数字 的 最 终 答 案 为 46.2. 





(а) 4.19355 (b) 4.19 
15.2 8 1 5.2 8 
5.9561 5.9 6 

12.3 12.3 
8.472 8.47 
46.20165 4 6.2 0 


(bp) 在 加 法 运算 中 保留 比 小 数 点 后 最 小 有 效 数 字 个 数 多 一 位 的 有 效 数 字 , 这 样 就 可 以 减少 一 些 计算 
其. 最 后 结果 舍 入 至 46.2, 与 (a) 中 结果 一 致 . (b) 的 运算 较 简 便 . 

计算 475 000 000 + 12 684 000 ~ 1 372 410, 假设 这 些 数 分 别 有 3 个 5 个 和 7 个 有 效 数 
F, 


解 EF 在 (a) 的 运算 中 , 所 有 的 数字 被 保留 ,最 后 结果 被 含 入 、 在 (b) 的 运算 中 , 使 用 类 似 于 习题 
1.10(b) 的 方法 .在 两 种 方法 中 ,用 斜体 字 表 示 疑 问 数字 . 


(a) 475000000 487684000 
+ 12684000 — 1372410 
487684000 486311590 

(b) 475000000 487700000 
+ 12700000 — 1400000 
487700000 486300000 


最 后 结果 舍 人 至 486 000 000; 或 为 了 突出 它 有 了 个 有 效 数字 ， 可 写 为 4.86 x 108. 
完成 下 列 运 算 . 


| (1.47562 -1.47322) x4895.36 
(a)48.0 x 943; (e) 0.000159180 
2 2 
(b)8. 35/98; (DESEE S 和 6 是 准确 的 , (4-38) + (5.482) 
(с)28 x 4193 x 182; (g)3.1416 /71.35; 


(d)526.7x0.001280 
0.000034921 ` 


解 EF (а) 48.0x943= 45 300 


(h) /128.5— 89.24. 


(b) 8.35/98 = 0.085 

(с) 28 X 4193 x 182 =2.8 x 10! x 4,139 x 10° х 1.82 x 102 
=2.8х4.193х1.82х10!*3*2 = 21 x 10% 
=2.1х107 


526.7 x 0.001280 5.267 x10? х 1.280 х 10? 





(d) 0.000034921 7 3.4921 x 1075 

_ 5.267 Х 1.280 10° x10 ° 

3.4921 10-5 
1023 10° 2145 
= 1.931 х = 1.931 х =—~ = 1,931 х 10 
1.931 х 025 1 1x 0757159 

= 1.931 х 10 
(е) 147562 — 1.47322 х 4895.36 _ 0.00240 х 4895.36 
e 0. 000159180 0.000159180 


~ 2-40 X 10`? x 4.89536 x 10° 
1.59180 x107 


_ 2.40 x 4.89536 (107° x 10°) 


= 1.59180 10“ 


10° 
= 7.38 х 一 -一 
10 `* 


= 7,38х 10% 
号 成 7.38 х 10 表示 3 个 有 效 数字 .注意 , 尽管 一 开始 所 有 的 数字 有 6 个 有 效 数 字 , 但 从 1.47562 Ж 
去 1.47322 时 ,它们 中 的 一 些 就 消失 了 . 


(ЖАВ 5 和 6 是 准确 的 , (4-38)- + (3.482)- = 3.84+5. 009=8.85 


(g) 3.1416 v 71.35=3.1416 x 8.447 = 26.54 
(h) v 128.5 – 89.24 = / 39.36.27 
1.13 МХ=3, Y= - 5,4 =4,В= -7 时 ,计算 下 列 各 式 的 值 ， 


(a)2X-3Y; (e) 2(X+3Y)-4(3X-2Y); 
_ ‚ _Х?-ү?_ 
(b)4Y -8X +28; (Оорт: 
АХ + BY. J2 Xy? 3A14} AR? 3. 
Оууу (в) /2Х?— ү?-342+4В2 +3; 
2 2 
(d) X?-3XY -2ү?; (h) ү °з- 2E 


解 > (а)2Х-ЗҮ=2х3—-3х(—5)=6+15=2]1 


()4Ү-8Х+28=4х(—5)-8х3+28= -20-24+28= -16 
()АХ+ВҮ 4x3+(-7)x(-5) 12+35 _ 4] 


BX -AY (-7)x3-4x(-5) -21+20 -1 74! 
(d) X -3XY -2Y?=3?-3x3x(-5)-2x(-5)?=9+45-50=4 
(е) 2(X+3Y)-4(3X ~2Y)=2[3+3x(-5)]-4[3x3-2x(-5)] 
=2x (3-15)-4x(9+10)=2x(-12)-4Xx19 
= —24-76= – 100 





PE F 2(X+3Y)-4(3X-2Y)=2X+6Y-12X+8Y= -10X + 14У 


= – 1003) +14(-5) = – 30 ~ 70= – 100 
-XY _03)2-(0-5)2 9-25 -16 1 
А? В?+1 (4)2-(-7)2+116-49+17 -32 2 


(g) У 2Х? ~ Ү?-3А?+4В?+3= у 203)? (- 5)2-3(4)2+4(-7)2 +3 
= / 18-25- 48 + 196+ 3 = /144= 12 


1642 2B /6x4 2х(-7)2 [95 98 
(Һ) БУ у = 37 + = 3 t 25 = У 12.43.52 
БЕ Ж ШЕП 


1.14 表 1.1 记录 的 是 PQR 农场 1987 一 1997 年 小 麦 和 玉米 的 产量 , 计量 单位 蒲式耳 (bu) 根 
据 这 张 表 判 断 (a) 小 麦 产量 最 低 的 年 份 ; (b) 玉 米 产 量 最 高 的 年 份 ;(c) 小 麦 减产 最 多 的 
年 份 ;(d) 上 述 年 份 中 哪 一 年 玉米 减产 而 小 麦 增产 ;(e) 小 麦 产 量 相等 的 年 价 . (ТУЛЫ 


‚15 


‚16 


玉米 总 产 攻 达到 最 大 的 年 份 . 





ЖҰ 1.1 
| 小 麦 年 产量 玉米 年 产量 
И (Фла ВАУ 5 ЖН) ( 舍 入 至 最 近 的 :5 蒲式耳 ) 
1987 75 
1988 90 
1989 100 
1990 85 
1991 80 
1992 100 
1993 110 
1994 105 
1995 95 
1996 110 
1997 100 


解 05 (а)1988 年 ;(b)1993 和 1996 年 ;(c)1992 Ж; (4)1990, 1994, 1995 和 1997 年 ;(ey1989 和 
1994 年 , 1990 和 1995 年 ;(f)1995 Ж. 

УЖ C 分 别 表示 习题 1.14 中 РОК 农场 的 小 麦 和 玉米 的 产量 .显然 W 和 C 都 是 关于 
年 份 1 НРА, Н W =F(i) 和 C=G(i) 表 示 . 


(a) 当 z=1993 时 ,分 别 求 W; (g) 变 量 上 的 定义 域 是 什么 ? 

(b) 当 :=1990 和 1996 时 , 求 C; (h)W 是 1 的 单 值 国 数 吗 ? 

(c) 当 W = 225 Н, Ж г; (Dt 是 W ARR? ле, ИН ра 107 
(d) Ж Е(1991); (j)C Æ ЈР 107 

(е) С (1995); (Юму 哪个 是 自 变量 ? 


(f) У № =210 时 , ЖС; 

# EF (a)210;(b) 分 别 为 85 和 110; (с)1989 和 1994; (4)240; (е)95; (f)110; (g)1987~ 1997; 
(h) 是 .对 于 定义 域 里 的 每 个 : , W 有 和 且 只 有 一 个 值 与 之 对 应 . 

(i) 是 .因为 对 W 的 每 个 值 ，: 都 有 多 于 一 个 的 值 与 之 对 应 (例如 , W =225 时 ,+ = 1989 和 t = 1994), 
这 个 函数 是 多 值 的 ,可 写 为 += НО). 

(j) 是 .因为 对 W 的 每 个 值 , C 都 有 一 个 或 更 多 的 值 与 之 对 应 , 如 表 1.1 所 示 . 同 理 ，W 是 C 的 函数 . 
(k) 通 常 我 们 会 认为 W 是 由 上 决定 的 ,而 不 认为 : 是 由 W 所 决定 的 .因此 ,1 是 自 变量 , WENTE. 
然而 ,从 数学 角度 来 看 ,任何 一 个 变量 可 视 为 自 变 量 ,另外 一 个 则 视 为 因 变 量 .可 取 不 同 什 的 变量 为 自 
变 基 ,由 它 决 定 的 变量 为 因 变 量 . 

变 基 Y 由 变量 X 确定 ,二 者 的 关系 由 等 式 Y=2X -3 决定 . 

(a) 当 X=3, -2 1.56, Үү; 

(b) 当 X= -2, 一 1,0,1,2,3 和 4 时 ,列表 求 Ү; 

(с)# Ү=Е(Х),Ж Е(2.4) 和 下 (0.8); 

(4) 4 Ү=15 8}, X; 

(е) X 能 表示 为 Y 的 函数 吗 ? 

(f)Y Æ X 的 单 值 函 数 吗 ? 

(g)X ЖҮ 的 单 值 函数 吗 ? 

解 F (a)X=3,Y=2X-3=2x3-3=6-3=3, 

Х= -2,Ү=2Х-3=2х(-2) -3= -4-3= -7, 

X=1.5, Ү=2Х-3=2х1.5-3=3=3=0), 

(b) 很 据 (a) 中 的 计算 , Y 的 值 列 在 表 1.2 中 .注意 到 根据 其 他 的 X 值 ,我 们 还 可 列 出 许多 表 . 





(с) F(2.4)=2x2.4-3=4.8—3=1.8, 
F(0.8)=2x0.8-3=1.6-3= —1.4. 
(d) Y=15 代 入 Ү=2Х-3.15=2Х-3,2Х =18,Х =9. 
(e) 是 .由 于 Y=2X-3,Y+3=2X, 即 X= 让 (Y+3).X 是 关于 Y 的 显 函 数 . 
(人 是 . 对 于 定义 域 里 的 每 个 X ,Y 有 且 只 有 一 个 值 与 之 对 应 . 
(g) 是 . RE Х=-у(Ү+з), 对 于 每 个 Y ,X 有 且 只 有 一 个 值 与 之 对 应 . 
Ж 2=16+4Х -ЗҮ, ЖАНУ 2418. (а) Х=2, Ү=5;(Ь)Х= -3,Y= -7; (с)Х = 
-4, Y = 2, 
Ш EF (а) 2=16+4х2-3х5=16+8-15 9; 
(b) 2=16+4х(-3) -3х(- 7) =16-12+21 = 25; 
(с) 2=16+4х(-4) -3х2-=16-16-6= ~ 6. 
给 定 X 和 Y, 就 有 相应 的 2 与 xX 和 YY 的 联系 用 Z= F(X, v) 来 表示 ( 读 作 *Z 是 关于 六 和 YY 
的 函数 "). FF(2,5) 表 示 当 X=2,Y=5 时 ,Z 的 值 , 这 个 值 为 9. 同 理 , F( - 3, -7)=25, 下 (一 4,2)= 
— 6. 
X 和 了 称 为 自 变 量 , Z 称 为 因 变 最 . 
在 坐标 系统 的 X 轴 上 根据 坐标 确定 点 的 位 置 (a)X=4;(b)X = —3;(с)Х =2.5;(4)Х 
= 一 4.3i(e)X=0.4. 假 设 所 有 数据 均 是 准确 的 . 
# EF 对 X 的 每 一 个 准确 值 ,在 X 铀 上 都 有 且 只 有 一 个 点 与 之 对 应 .用 进一步 的 数学 知识 还 可 证 
明 在 轴 上 的 任 一 个 点 都 有 且 只 有 一 个 XX 值 与 之 对 应 . 


с^ 
+ en ч му 
| ! © сї + 
fi | ЇЇ | Il 
>< x >< >< < 
-5 -4 -3 -2 -] 0 ] 2 3 4 5 


因此 , 从 理论 上 讲 , 有 一 个 点 与 X= 22/7 = 3 142857142857… 相对 应 ,有 另 一 个 点 与 对 = x = 
3.14159265358… 相 对 应 .当然 在 应 用 中 ， 由 于 我 们 的 笔迹 有 厚度 并 且 它 覆盖 了 无 穷 多 个 点 , 因此 我 们 
不 可 能 找 出 一 个 点 的 确切 位 置 . X 轴 本 身 也 有 厚度 . 所 以 我 们 所 作 的 图 只 是 实际 数学 情况 的 形式 代表 . 
X 表示 一 滚珠 轴承 直径 ,单位 是 厘米 (cm) .如 果 久 =4.58 有 三 个 有 效 数 字 , 那么 如 何 
ЕХ Ет? 


4.54 4.55 4.56 4.57 4.58 4.59 


解 EF 4.58 cm 的 真实 测量 值 处 在 4.575 cm 和 4 585 ст 之 间 , 用 粗 线段 在 上 图 中 表示 . 

在 豆角 坐标 系 中 找 出 下 列 点 的 位 置 : (a)(5,2);(b)(2,5);(c)( -3 1);(d)(1, -3) 
(е)(3, —4);(#)(—2.5, 一 4.8);(g)(0， -2.5);(h)(4,0). 假 定 所 有 数 均 是 准确 的 . 

Ж E&F 见 图 1-2. 

到 出 方程 yY=2X-3 的 图 . 


R EF 找 出 X= -2， 1,0,1,2,3 和 4, 分 别 求 出 Y= -7,-5,-3, 一 1,1,3 和 5( 见 习题 1.16 


+ 
bd 


(b)) .因此 图 上 的 点 为 (-2, -7),(-1, -5).(0, -3) (1, 一 1),(2,1), (3,3) 和 (4,5), 把 它们 标 于 直 
АЊА, 如 图 1-3 所 示 . 所 有 这 些 点 以 及 用 其 他 X 值 算出 的 点 均 在 一 条 直线 上 , 这 条 直线 即 为 所 





KAR. 


因为 了 Y=2X-~3 的 图 像 为 一 条 直线 ,所 以 我 们 称 F(X) =2X -3 为 线性 函数 .一般 地 ,FE(X)= 
aX +b(a 和 6。 是 任意 常数 ) 是 线性 洋 数 , 它 的 图 像 是 一 条 直线 . 

实际 上 , 只 要 两 个 点 就 能 确定 一 个 线性 函数 , 因为 两 点 确定 一 条 直线 . 
作 方 程 Y= Х2-2Хх -8 的 图 像 . 
ШО F 根据 不 同 的 X 值 ,对 应 的 Y 值 列 在 表 1.3 中 .例如 , 当 X= -2 时 , Y=(-2)?-2x(-2) 
-8=4+4-8=0. 从 表 中 可 以 看 出 , (一 3,7), (一 2,0), (一 1, 一 5), (0, -8), (1, -9), (2, -8),(3, 


-3) (4,0) 和 (5,7) 这 些 点 以 及 用 其 他 X 值 算出 的 点 均 在 如 图 1-4 所 示 的 曲线 中 .这 条 曲线 称 为 抛 
ИЖ А Е(х)= Х?-2Х -8 ЖБ ЖЫ. 


1.3 
н 
Х -3 -2 -1 0 1 2 3 4 5 
Ё S A 
Y 7 0 -5 -8 -9 -8 -5 0 7 
| 

7 
7 
6 
5 
4 
3 
2 
] 
O 






- 般 地 ,方程 Ү= а +ЬХх + XUB P a,b Me 是 常数 ,并 且 - 关 0) 的 图 像 是 抛物 线 , 如 果 c = 0, 
那么 图 像 是 --- 条 直线 , 参见 习题 1.21. 
表 1.4 给 出 了 从 1990 到 1994 Æ HIV 患者 出 院 的 人 数 ( 以 于 计 ). 根 据 数据 作 图 . 


表 1.4 
年 份 1990 1991 1992 1993 1994 
HIV 患者 出 院 人 数 146 165 194 225 234 





来 源 :美国 国家 健康 统计 中 心 , 健康 与 生死 统计 . 


К F 解法 一 ”观察 图 1-5. 在 此 图 中 , HIV 病人 出 院 的 人 数 是 一 个 因 变 量 , 时 间 是 自 变量 .点 的 
坐标 按照 坐标 表示 法 的 习惯 确定 ,如 (1990,146). 用 直线 把 点 连接 起 来 .此 图 像 称 为 线 图 . 

注意 , 轴 上 的 单位 长 度 是 不 等 的 .这 是 因为 2 个 变量 代表 的 是 不 同 的 数量 .注意 图 中 的 零点 在 竖 
轴 而 不 在 横 轴 上 .通常 ,零点 应 尽 可 能 地 表示 出 来 ,尤其 是 在 坚 轴 上 ,如果 在 某 些 情况 下 无 法 表示 出 有 零 
总 ,并且 这 样 的 忽略 会 造成 读者 的 误解 ,那么 最 好 用 某 些 方法 提醒 读者 注意 这 里 的 忽略 .有 一 些 变 量 
是 时 间 的 函数 ,表示 这 种 函数 分 布 的 表 或 图 称 为 时 间 序 列 . 
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HIV 患 者 出 院 人 数 (TA) 
= 


50 
0 
1990 1991 1992 1993 1994 
年 份 
图 1-5 HIV 患者 出 院 人 数 (来 源 :美国 国家 健康 统计 中 心 ， 
健康 与 生死 统计 ) 


解法 二 图 1-6 称 为 条 形 图 .只 要 条 与 条 之 间 不 相交 , 条 带宽 可 以 制 成 任意 方便 的 尺寸 . 
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HIV 患 者 出 院 人 数 (CTA) 
= 
< 





1990 199] 1992 1993 1994 
年 份 


图 1-6 НУ 患者 出 院 人 数 (来 源 : 美 国 国家 健康 统计 
中 心 ,健康 与 生死 统计 ) 


解法 三 жам E Eh Н ЖП Ил АЛЕН КЕҢ ЖЕ ЖЕ, 9 1-7 К. 
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HIV 患者 出 院 人 数 (FA) 


1-7 HIV 患者 出 院 人 数 ( 来 源 : 美 国 国 家 健康 统计 中 心 ， 
健康 与 生死 统计 ) 


1.24 根据 习题 1.14 的 数据 , 做 (a) 线 图 , (b) 条 形 图 . 
М F (a) 线 图 如 图 1.8 所 示 . 
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了 了 ”Tv 一 
1987 1989 1991 1993 1995 1997 
年 份 
图 1-8 


(b) 图 1-9 和 1-10 展示 了 两 种 类 型 的 条 形 图 .图 1-.10 中 的 图 形 称 为 分 支 条 形 图 . 
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R] 1-9 
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图 1-10 


1.25 (a) 根 据 习题 1.14 的 表 1.1, 写 出 小 麦 和 玉米 的 年 产量 占 全 年 产量 的 百分比 . 
(b) 根 据 (a) 得 到 的 数据 作 百 分 比 图 . 
И 097 (а) 13 1987 年 , 小麦 所 占 百分比 为 200/(200 + 75) = 72.7%, 玉米 所 占 的 百分比 为 100% 
-72.7% =27.3% .百分比 如 表 1.5 所 示 . 





小 麦 (%) 
玉米 (%) 


72.7 67.3 
27.3 32.7 









1987 1988 1989 1990 1991 


69.2 74.6 75.0 66. 1 65.6 68.2 72.5 67.7 
30.8 25.4 25.0 33.9 34.4 31.8 27.5 32.3 


表 1.5 


1992 1993 1994 1995 






70.1 


(b) 由 (a) 而 得 的 百分比 图 如 图 1-11 所 示 , 称 为 百分数 分 支 图 . 也 可 作 类 似 于 图 1.9 的 条 形 图 . 





1987 1988 1989 1990 1991 1992 1993 1994 19951996 1997 
+0 


图 1-11 


1.26 根据 表 1.1 中 小 麦 产量 作 线 图 . 


解 F 所 求 直线 可 通过 去 掉 图 1-8 中 较 低 的 那 条 线 图 而 得 .结果 在 线 图 和 横 轴 之 间 有 大 片 空间 被 

浪费 了 .为 了 避免 产生 这 种 情况 , 竖 轴 可 以 从 150 蒲式耳 开始 ,而 不 从 0 蒲式耳 开始 .然而 , 这 也 许 会 
给 没有 注意 到 零点 的 读者 带 来 误解 .为 了 提醒 读者 ,我 们 可 以 如 图 1.12 那样 作 图 . 

为 一 种 提醒 大 家 注意 零点 被 忽视 的 方法 是 在 一 一 条 轴 上 用 锯齿 形 线 表示 , 参见 图 1- 13. 
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E 1-13 
1.27 表 1.6 给 出 了 美国 境内 五 大 湖 的 面积 , 请 根据 数据 作 图 . 


1.6 


ЖЕШ | 22 342 
苏 比 利 尔 湖 | 20 557 
体 伦 潮 | 8 800 
PAR | 5 033 
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安 大 赂 
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面积 《平方 英里 》 
9 1-14 五 大 湖面 积 ( 平 方 英里 ) 





25000 


解 eF 解法 一 图 1-14 是 -个 水 平 条 形 图 . 按 湖 的 面积 由 小 到 大 排列 . 

解法 二 图 1-.15 称 为 圆 形 图 . 为 了 作 圆 形 图 ,我 们 这 样 来 考虑 :总 面积 60 178 平 方 英 里 ,对 应 于 物 个 
圆 的 角度 数 , 即 360". 因 此 ,1 平方 英里 对 应 于 360"/60 178. 苏 比 利 尔 湖 的 20 557 平方 英里 对 应 角度 
是 20 557 х (360°/60 178) = 123", 而 密 欢 根 湖 、 休 伦 湖 、 伊 利 湖 和 安大略 湖 对 应 的 角度 分 别 为 134°, 


53°, 30° 和 20" .可 用 其 角 器 作出 所 需 角 度 . 


苏 比 利 尔 湖 (20557, 34.2%) 


密歇根 湖 (22342, 37.1%) 安大略 湖 (3446, 5.7%) 


伊利 湖 (5033, 8.4%) 


休 伦 湖 (8800 ,14.6%) 


图 1-15 五 大 湖面 积 


1.28 长 度 为 工 ( 厘 米 ) 的 单 摆 作 一 次 完整 的 摆动 所 需 的 时 间 为 TO), ШЖ 1.7 所 示 , 这 些 观 
察 值 均 出 自 于 物理 实验 室 . 
(а) 用 图 像 表 示 关 于 工 Т. 
(b) 从 (a) 的 图 中 ,估计 单 摆 长 度 为 40 cm 时 的 工 值 . 





解 F (a) 图 1-16 用 光滑 曲线 将 观察 值 点 连接 了 起 来 . 
(b) 械 的 估计 值 为 1.27 Ф). 





方程 

1.29 解 下 列 方程 ， 
(a)4a -20 =8; (c)18-5b=3(b+8)+10; 
(b)3X +4=24-2Х; Crai EES 


Я EF (a) 两 边 同 时 加 上 20: 4a-20+20=8+20, 即 4a=28. 
两 边 同 时 除 以 4， 4a/4=28/4, 得 a=7. 
检验 : 4x7-20=8,28-20=8, 得 8=8. 
(b) 两 边 同 时 减 去 4: 3X+4-4=24-2X-4 即 3X=20-2X. 
两 边 同 时 加 上 2X; 3X+2X=20-2X+2X, 即 5X=20. 
两 边 同 时 除 以 $， 5X/S= 20/$, 得 X=4. 
检验 :3x4+4=24-2x4,12+4=24-8, 得 16=16. 

注意 , 方程 中 任何 一 项 可 移动 , 即 从 一 边 移 动 到 另 一 边 , 且 符 号 改变 , 称 之 为 移 项 , 这 样 方程 的 求 
解 就 方便 多 了 .因此 我 们 写成 : 

3X+4=24-2X 3Х+2Х=24-4 5Х=20 X=4 

(c)18— 56 = 36 + 24 + 10, 15 18 – 52 = 30 + 34. 
移 项 : – 56 – 36 = 34 – 18, В – 86 = 16. 
除 以 -8; - 85/(-8) = 16/(— 8), b=-2. 
19:18 -5х(-2) =3х(-2+8) +10,18+10=3х6+ 10, 8 28-28, 


(d) 两 边 同 时 乘 以 最 小 公 倍 数 6, 
Y+2 Yo 24 2) 6Y _ 
3 +1| = 6 > 623 +6 = % 2(Y +2) +6 = ЗҮ 
2Y +4+6=3Y 2Y+10 = ЗҮ 10=3Y-2Y Y = 10. 


6 





6 


oi arana i aa Eir ESETA CEEI 
解 下 列 联 立 方程 : 
(a)3a -2b = 11 (b)SX + 14Ү =78 (c)3a +2b+5c=15 
5а +7Ь=39; ТХ +3Y= -7; 7а - ЗЬ + 2с = 52 
5а +6 - 4с= 2. 
# ЕР (а) Ж 980 7. 21а -145=77 (1) 
第 二 式 乘 以 2，，10a +146 = 78 (2) 
相 加 : 31а = 155 
除 以 31: а = 5 


注意 ,在 给 定 方程 两 边 同 时 乘 以 适当 的 数 ,我 们 能 写 出 两 个 等 价 方程 (1) 和 (2)， 在 这 两 式 里 未 知 
数 6 的 系数 数值 是 相等 的 .然后 通过 加 法 ,我 们 就 能 消去 未 知 数 b, 得 到 。 

把 a=5 带 入 第 一 个 方程 ,3x5-26=11, -26= -4, 得 5=2. 因 此 a=5,6=2. 
检验 :3x5-2x2=11,15-4=11,11=11;5x5+7X2=39,25+14= 39,39=39. 


(b) 第 一 式 乘 以 3: 15X +42 Ү = 234 (3) 
BIAL - 14: -98Х- 4) Ү-98 (4) 
相 加 : -83X = 332 
除 以 ~ 83; Х=-4 


把 X= -4 代入 第 一 式 :$(-4)+14Y=78， 14Y=98, 了 =7. 因 此 X= -4, Y =7. 
检验 :5( -4)+14x7=78， -20 + 98 = 78, 78 = 78;7(-4) +3х7= -7, -28+21= -7,-7=-7. 


(c) 第 一 式 乘 以 2， ба +4Ь+ 10с =30 
第 二 式 乘 以 - 5， – 35а + 15b -10c = -260 
ЖП: – 29а +19% = – 230 (5) 
第 二 式 乘 以 2. 14а-6Ь+ 4с =104 
第 三 式 照 抄 . 5а+ b- 4c =2 


一 


ЛНП. 19а ~ 5 = 106 (6) 


我 们 消去 了 cc, 还 剩 下 两 个 方程 (5) 和 和 (6) 来 同时 求 出 wa Mo. 


(S) 式 乘 以 5. -145a +95 b= — 1150 
(OAF 19; 361а – 95 b = 2014 
#920; 216а = 864 
除 以 216: a=4 


把 a=4 代 入 (5) 或 (6), 我 们 得 到 b= —6. 

jE a =4,b = -6 代入 任何 一 个 给 定 方 程 ,我 们 得 到 с=3. 

因此 a=4,6= -6,c=3. 

检验 :3xX4+2(-6)+5xX3=15,15=15;7X4-3(-6)+2x3=52,52=52;5xX4+(-6)-4x3=2, 


2=2. 
不 等 式 
1.31 用 语言 表达 下 列 各 式 含义 ， 
(а) М >30; (b) Х<12; (с)0< р<1; (d) -2t<X<u+t2t. 


解 F (a)N 比 30 大 . 
(b)X 小 于 或 等 于 12. 
(c)p 比 0 大 但 小 于 或 等 于 1. 
(d)X 比 4-2t 大 但 小 于 w+2z， 
1.32 用 符号 表示 下 列 各 式 : 
(а) X 的 值 可 介 于 2 和 5 之 间 , 并 可 等 于 2 和 5; 
(b) 算术 平均 值 Х 比 28.42 大 ,但 比 31.56 小 ; 
(с) ЕЖ m 小 于 等 于 10; 
(4) Р 是 一 非 负数 . 


解 б> (a)? < Х<<5;(Ь)28.42< Х<31.56;(с)0< лз ®10;(4)Р:®0. 


1.33 按 要 求 用 不 等 号 排列 数字 3.42, -0.6, -2.1,1.45 和 一 3. 

(a) 按 大 小 升序 排列 ; 

(b) 按 大 小 降序 排列 . 

解 & (a)-3< -2.1< -0.6<1.45<3.42; 

(b)3.42>1.45> -0.6> -2.1> -3. 

这 些 数字 作为 点 画 在 一 直线 上 (见习 题 1.18), 它 们 从 左 至 右 逐 渐 增 大 . 
1.34 ЖРА, ЖЩ X 的 对 应 不 等 式 ( 即 解 X 的 不 等 式 ). 
3 一 2X 

5 





(а)2Х<6; (с)6-4Х< —2; (е)-1< 


(b)3X - 8224; (а) -3< %7 <3; 


解 EF (a) 两 边 同 时 除 以 2, 得 X<3. 

(b) 两 边 同 时 加 8,3X 之 12; 两 边 同 时 除 以 3, Х;>4. 

(c) 两 边 同 时 加 -~ 6, -4X < - 8; 两边 同 时 除 以 - 4, X >2. 注意 , 在 不 等 式 里 ， 我 们 可 以 像 在 等 式 中 一 
КЁ, 通过 改变 符号 把 一 项 从 不 等 式 的 一 边 移 到 另 一 边 . 比如， ТЕ(Ъ)#Р,3Х>4+8. 

(d) 两 边 同 时 乘 以 2, -6<X-5<6; 两 边 同 时 加 5, -1<X<11. 

(e) 两 边 同 时 乘 以 5, - 5 委 3 - 2X 雪 35; 两 边 同时 加 一 3, -8< -2Х<32; 两 边 同 时 除 以 -2,42 XÈ 
– 16, —16<Х<4. 


<7. 


对 数 和 反对 数 


1.35 指出 下 列 数 的 常用 对 数 (以 10 为 底 ) 的 首 数 : 
(a) 57; (4)35.63; (g)186 000; (3)0.0325; 


(Ь)57.4; (е)982.5; (Һ)0.71; (к)0.0071; 

(с)5.63; (97824; (10.7314; (1)0.0003. 

解 F (а)1; (Ь)1,; (с)0;(4)1; (6)2; (003; (6)5; (Һ)9 - 10; (1)9- 10; (3)8 – 10; (k)7 - 10; (1)6 - 10. 
1.36 ЖХ}. 

(а)10687.2; (0) 1060.382; (к)10р4.638; (p)log0. 2548 

(b)log37 300; (g)log0.00159; (1)log6.753; (q)log0. 04372; 

(c)log753; (h)log0. 0753; (m)log183.2; (r)log0. 009848; 

(4)1069.21; (1)1060.000827; (n)log43.15; (s)log0. 0001788. 


(е)10854. 50; . (j)log0.0503; (о)102876 400; 
ИЕ ES (а) ЕЖ = .9405, 首 数 =1, 因 此 log87.2= 1.9405; 


()4. 5717 

(с)2.8768 

(4)0. 9643 

(е)1.7364 

(有) 尾数 = . 5821, ВЖ = 9 – 10; AE 1080. 382 = 9. 5821 – 10. 

(g)7.2014 – 10 

(Ь)8.8768 – 10 

(1)6.9175 – 10 

(38.7016 - 10 

(k)log4638 的 尾数 是 1064630 和 1084640 EREM 0.8 1%. 
1084640 的 尾数 = .6665 
log4630 的 尾数 = . 6656 





Æ = 0009 
1084.638 的 尾数 = . 6656 + 0.8 х 0.0009 = . 6663; E] № log4. 638 = . 6663. 这 个 过 程 称 为 线性 播 值 .如 
需要 ,附录 娃 的 相应 内 容 可 直接 用 来 求 出 尾数 (66$S6 +7). 
(1)0.8295(8293 + 2) 
(m)2.2630(2625 + 5) 
(n)1.6350(6345 + 5) 
(о)5.9427(9425 + 2) 
(р)9.4062 – 10(4048 + 14) 
(9)8. 6407 – 10(6405 + 2) 
(г)7.9933 - 10(9930 + 3) 
(ѕ5)6.2524 – 10(2504 + 20) 


1.37 求 反 对 数 . 
(a)antilogl] . 9058; (c)antilog7. 8657 – 10; (f)antilog2.6715 
(b)antilog3. 8531 (d)antilog9. 8267 ~ 10 antilog4. 1853 
antilog2. 1875 antilog2.3927 antilog0. 9245; 
antilog0 . 4997 antilog7 .7443 – 10; (gJantilog1 . 6089 
antilog4 . 9360; (e)antilog9. 3842 – 10; antilog8. 8907 – 10 


antilog1.2000. 
ЯФ EF (а), . 9058 的 尾数 对 应 数字 是 805. 由 于 首 数 是 І, 所 求 数 小 数 点 前 一 定 有 两 位 数 ， 


因此 所 求 的 数 为 80.5( 即 ,antilogl .9058 = 80.5). 
(bjantilog3.8531 = 7130, antilog2. 1875 = 154, antilog0.4997=3.16,antilog4.9360 = 86 300. 

(oR MF, .8657 的 尾数 对 应 数字 是 734. 由 于 首 数 是 7 - 10, 所 求 数 小 数 点 后 直接 跟 有 两 个 零 . 因 
此 所 求 的 数 为 0.00734( 即 ,antilog7.86$7- 10 = 0.00734) .可 查阅 附录 而 中 的 相关 内 容 . 

(d)antilog9. 8267 – 10 =0.671， antilog2. 3927 = 0.0247, antilog7 . 7443 — 10 = 0.00555. 

(e) 由 于 在 表 中 找 不 到 相应 尾数 , 必须 使 用 插值 法 

log2430 的 尾数 = .3856 给 定 尾数 = .3824 

log2420 的 尾数 = .3838 下 一 个 更 小 的 尾数 = .3838 


22 = .0018 25 = .0004 
因此 2420 + (4/18) (2430 — 2420) = 2422, 所 求 数 为 0.2422. 
(Р апор2. 6715 = 469.3(3/9 х 10223), antilog4. 1853 = 15 320(6/28 х 1022), antilog0. 9245 = 8.404 
(2/5 x 10= 4). 
(g)antilogl . 6089 = 0. 4064(4/11 х 104), antilog8. 8907 – 10 = 0. 07775(3/6 x 10 = 5), antilog1 . 2000 
= 15.85(13/27 x 10=5). 


用 对 数 计算 


用 对 数 计 算 下 列 各 式 的 值 . 
1.38 P=3.81x 43.4. 
Ж EF logP=log3.81 + log43.4 log3.81 = 0.5809 
(+ )log43.4 = 1.6375 


lgP = 2.2184 
因此 已 =antilog2.2184= 165.3, 或 保留 三 个 有 效 数 字 得 165. 注意 指 数 形式 的 运算 ， 
3,8] X43.4= 100-2809 x 101-6375 — 109-2809 + 1.6375 _ 102: 2184 = 165.3 
1.39 Р= 73.42 х 0.004620 х0. 5143. 


解 EEF logP = 10873.42 + 1020).004620 + log0.5143 


10873.42 = 1.8658 
(+ )1020.004620 = 7.6646 – 10 
(+ )1060.5143 =9.7112- 10 


logP = 19.2416 – 20 = 9.2416 – 10 
因此 P =0.1744. 
784.6x0.0431 
1.40 Р= од 


解 EF logP = 106784.6 + 1060.0431 – 10628.23 


log 784.6 = 2.8947 
(+ )10р0.0431 =8.6345 — 10 


11.5292 - 10 
( — )log 28.23 = 1.4507 


logP = 10.0785 — 10 = 0.0785 
因此 P=1.198, 或 保留 三 个 有 效 数字 得 1.20. 注意 指数 形式 的 运算 . 


784.6 x 0.0431 _ 1078947 x 108.6%45-10 


28.23 1.4507 = 102:8947+8.6345-10-1.4507 
„ 10 . 


= 10% 0785 — 1.198 


1.42 


1.43 


1.44 


变量 


1.46 


1.47 


Р = (5.395). 
Ж EF logP = 8log5 . 395 = 8 x 0. 7320 = 5.8560, P = 717800 кў 7.178 х 10°. 


Р = / 387.2 = (387.2). 


Ж F logP = 3-108387.2 = py x2.5879=1.2940, P=19.68. 


P = (0.08317)!5. 


Ж ЕР logP -= 21-1060. 08317 = 1 x (8. 9200 - 10) = L х (48. 9200 - 50) = 9. 7840 – 10, 


P = 0.6081. 


р — y 0.003654 х 18.37? 
8.724 х /743.8 ` 


Ш EF logP = 21080 .003654 + 310р18. 37 – (4log8 . 724 + 1-108743.8) 
分 子 N 分 母 DD 


log0.003654 = 21-07. 5628 – 10) 4iog8. 724 = 4 х 0.9407 = 3. 7628 


=-у (17.5628 – 20) = 8.7814 - 10 1108743.8 = 2. х 2.8714 = 0.7178 


310818.37 =3х 1.2641 = 3.7923 
相 加 logN =12.5737-10 ЖШ: logD =4.4806 
(=) logD =4.4806 


logP =8.0931-10 
Р =0.01239 


p= |874.3x0.03816x 28.533 
1.754 х 0.007352 ` 





Ш EF logP = 21-0874. 3 + 1060 .03816 + 31028.53 – (410в1.754 + log0 . 007352) ] 


108874. 3 = 2.9417 = 2.9417 
1060.03816 8. 5816 – 10 8.5816 – 10 
310228. 53 =3х1.4553 =4.3659 








ЛЇЇ: 15.8892 - 10 

4log1.754 =4х 0.2440 =0.9760 

10р0.007352 = 7.8664 ~ 10 

相 加 8.8424 ~ 10 
从 (1) 和 (2) 我 们 得 到 ， 


logP = 方 [(15.8892- 10) ~ (8.8424 – 10)] = 六 х 7.0468 = 3.5234, P = 3338. 


仆 充 习题 


指出 下 列 哪些 是 离散 数据 ,哪些 是 连续 数据 ， 

(а) 一 个 城市 一 年 中 不 同月 份 的 降雨 量 ; 

(b) 一 辆 汽车 的 速度 (英里 /小 时 )， 

(с) 任意 时 刻 20 美元 面值 的 货币 在 美国 流通 的 数量 ， 

(а) 股票 市 场 每 天 抛售 的 股票 总 值 ， 

(е) 几 年 内 一 所 大 学 的 学 生 入 学 人 数 . 

给 出 下 列 变量 的 值 域 ,并 指出 哪些 是 连续 变量 ,哪些 是 离散 恋 明 


(1) 


(2) 


(a) -农场 几 年 内 每 英 直 小 麦 产 量 W; 
(b) 个 家 庭 的 成 员 人 数 М; 

(с) 一 个 人 的 婚姻 状况 ; 

(а) -- 枚 导弹 飞行 的 速度 T; 

(е) -RERE RR P. 


数据 伟人 , 科学 记 数 和 有 效 数 字 


1.48 








按 要 求 对 下 列 数 据 进行 舍 入 ， 

(a)3256 舍 入 至 最 近 的 百 位 ; ({)3 502 378 EA ZERUA JAL; 
(b)5.781 低 入 至 最 近 的 十 分 位 ;  (g)148.475 舍 入 至 最 近 的 整数 位 ， 
(с)0.0045 舍 入 至 最 近 的 二 分 位 ; (Һ)0.000098501 含 和 人 至 最 近 的 百 万 分 位 ; 
(d)46.7385 舍 入 至 最 近 的 百 分 位 ; (1)2184.73 舍 入 至 最 近 的 十 位 ， 
(е)125.9995 保留 两 位 小 数 ，; (3)43.87500 舍 入 至 最 近 的 百 分 位 ; 

1.49 不 用 10 的 医 形 式 表 示 下 列 数字 
(a)132.5 x 10°; (с)280 x 1077; (е)3.487х 107°; 

(b)418.72x 107°; (d)7300 x 10%; ({)0. 0001850 x 10°. 

1.50 假定 下 列 数 字 是 精确 记录 的 ,在 每 个 数 里 有 几 个 有 效 数字 ? 

(a)2.54 EX; (d)3.51x 10° АЖЕ; (g)378 Ж];  (j)100.00 英里 ; 
(Ъ)0.004500 #9; (е)10.000100 ЖК; (h)4.50 x10 2-Ж*Ж; 
(с)3 510 000 $AH; ({)378 Л; (i1)500.8 x 10% Ез. 

1.51 假定 下 列 数 字 是 精确 记录 的 ,在 每 个 数 里 有 几 个 有 效 数 字 ? 每 个 数 的 最 大 误差 是 多 少 ? 
(a)7.20 x 105 蒲式耳 ; (с)5280 ЖК. (е)186 000 英里 / 秒 ; 
(b)0.00004835 ЖЖ; (d)3.0 x 108 Ж; ({)186 Е ур. 

1.52 用 科学 记 数 法 书写 下 列 数字 (除非 另外 说 明 , 否则 认为 数字 是 精确 记录 的 ) 
(а)0.000317; (d)0. 000009810; 

(b)428 000 000( 四 个 有 效 数字 ); (е)732 ^F: 
(с)21 600.00; (£)18.0 的 干 分 之 十 . 

数值 计算 

1.53 假设 72.48 和 5.16 分 别 有 4 个 和 3 个 有 效 数字 ,说 明 它们 的 (a) 乘 积 ;(b) 商 不 能 精确 到 超过 3 个 有 效 
数字 . 写 出 精确 的 乘积 和 商 . 

1.54 完成 下 列 运 算 . 

| 873.00. | 0.00480 х 2300 
(а)0.36 х 781.4; (b) вәт (с)5.78 х 2700 х 16.00; (9) 0208 ; 
П2б 0.5386 01614(12 д); 416 000 х 0.000187 
(е) v 120 х0. 5386 х 0.4614(120 是 准确 的 ) ө 
(6)14.8641 + 4.48 – 8.168 + 0.36125; (Һ)4 173 000 – 170 264+ 1 820 470 — 78 320 (数据 分 别 精确 到 4 
个 ,6 个 ,6 个 ,5 个 有 效 数字 ); 
GA IREZ дус 172 
(i) J EBBE 3X647] (3,6 和 7 是 准确 的 ); 
3 iex (G РҮ E AZEZ 
l 3.1416 x (9.483? - 5.0752) 
(04.120 { 0.0001980 

1.55 4 U= -2, у= 1/2, W=3,X= –4, Y =9, Z =1/6 时 , 求 下 列 各 式 的 值 .假设 所 有 数据 是 准确 的 . 

(а) 40 +6V-2W; (ЗХ(4У +32) -2Ү(6Х- 57) – 25; 
XYZ W-2)° (ү-5)2 

(b) рур: (8) HA ,(Ү сз, 
2Х- зү X-3 

(с) —=——,‚, (h) ; 
UW+XV (Y -4)} + (U +5} 

(d) 3(U-X¥Y+Y (i) X?+5X°-6X-8; 

(е) V U?-2UV+W; (} жал 
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.$7 


‚58 


‚59 


-60 


‚61 
‚62 
‚63 


变量 X 和 YY 的 关系 由 方程 Y=10-4X RE. 

(a) 当 X= -3,-2,-1,0,1,2,3,4 和 5 时 , 求 了 .并 把 结果 列 在 表 中 

(b) 4 Х= ~ 2.4, 一 1.6, –0.8,1.8,2.7,3.5 14.68, Y; 

(с) WR X 和 YY 的 关系 由 方程 Y= F(X) 表 示 , 求 F(2.8),F(-5),FGW2) 和 下 ( -天 ); 

(d) 当 Y= -2,6, -10,1.6,16,0 和 10 Е, KHH X; 

(e) 用 ҮҖЖ# АХ. 

ШЖ 2= Х? ~ Ү?, 4(a)X=-2,Y=3;(b)X=1,Y=5 时 , 求 Z;(c) 如 用 函数 记 法 Z= 下 (X, Y), R 
F(-3, -1). 

ШЖ W =3XZ -4Y?+2XY, 当 (a)X=1,Y= -2,Z=4;(bÞ)X= -5 Y= -2,2=0 8, И; (с) 
用 函数 记 法 W= Е(Х, Ү, 2), Е(3,1, - 2). 

在 直角 坐标 系 中 标 出 下 列 各 点 :(a)(3,2),(b)(2,3),(c)(-4,4),(d)(4, -4), (е)( 3, -2),(f)( -2， 
73), (g)(-4.5,3), (h)(~1.2, —2.4),(i) (0, -3), G)(1.8,0). 


作出 下 列 方程 的 图 像 (a)Y= 10 - 4X( 参 见习 题 1.56);(b)Y= 2X+5， (DOY= 于 (X- 6), (d)2X+3Y 
= 12, (e)3X-2Y=6. 

作出 下 列 方程 的 图 像 (a) Y=2X?+ X – 10, (Ь)Ү=6-3Х - Х2. 

作 Y 了 =X -4X+12X-6 的 图 像 . 

表 1.8 给 出 了 从 1989 到 1995 年 间 , 男性 和 女性 艾滋 病 患者 死亡 人 数 . 在 同一 坐标 系 中 根据 数据 作出 
两 条 相应 的 线 图 . 


表 1.8 
年 份 1989 1990 1991 1992 1993 1994 1995 
男性 23 742 26 752 30 725 34 072 35 551 37 360 26 375 
女性 2 613 3 182 3 926 4 741 5 526 6 615 4 881 


来 源 :美国 疾病 控制 中 心 ， 


1.64 利用 表 1.8 中 的 数据 ,建立 与 图 1-9 和 图 1-10 相似 的 条 形 图 
1.65 根据 习题 1.63 的 表 1.8， 写 出 男性 和 女性 艾滋 病 患 者 年 死亡 人 数 占 所 有 艾滋 病死 亡 人 数 的 百分比 根 


据 这 些 百分比 作出 百分数 分 支 图 . 
1.66 表 1.9 给 出 了 美国 1990 到 1994 年 间 白 人 和 有 色 人 种 每 1000 个 新 生 儿 的 婴儿 死亡 率 , 用 适当 的 图 形 
来 描绘 数据 情况 . 
表 1.9 
年 份 1990 1991 1992 1993 1994 
日 人 7.6 7.3 6.9 6.8 6.6 
有 色 人 种 15.5 15.1 14.4 14.1 13.5 


来 源 : 美 国 国家 健康 统计 中 心 , 美国 生死 统计 . 


1.67 表 1.10 给 出 了 太阳 系 中 行星 的 轨道 行驶 速度 (英里 / 秒 )， 根据 数据 作 图 . 





1.68 表 1.11 给 出 了 2000 — 2006 年 公立 学 校 从 天 到 8 年 级 ,9 一 12 年 级 及 大 学 计划 入 学 人 数 (以 千 记 ) .用 


线 图 、 条 形 图 和 分 支 条 形 图 作 图 . 
表 1.11 
年 份 2000 2001 2002 2003 2004 2005 2006 
K~8 Æ% | 33 852 34 029 34 098 34 065 33 882 33 680 33 507 
9~12 年 级 | 13804 13 862 14 004 14 169 14 483 14 818 15 021 
大 学 12 091 12 225 12 319 12 420 12 531 12 646 12 768 


来 源 :美国 国家 教育 及 规划 统计 中 心 ,年 鉴 


1.69 根据 表 1.11 的 数据 作 百分数 分 支 图 . 
1.70 表 1.12 显示 美国 1995 年 男性 和 女性 (18 岁 以 上 ) 的 婚姻 状况 .根据 数据 ， (a) 用 同一 直径 作 两 个 相应 圆 
形 图 ,(b) 作 一 你 任 选 的 图 形 . 





表 1.12 
婚姻 状况 女性 ( 占 总 数 百分比 ) 
未 婚 19.4 
E 59.2 
ЕВ 11.1 
离婚 10.3 





1.71 表 1.13 给 出 了 1987—1994 年 美国 破产 申请 文件 总 数 .根据 所 给 数据 ,作出 相应 类 型 的 图 


表 1.13 
年 份 1987 1988 1989 1990 1991 1992 1993 1994 
к=н 561 278 594 567 642 993 7254 88 
84 0399 972 490 
文件 总 数 918 734 845 257 


来 源 :美国 法 院 行政 管理 办 公 室 , 主任 年 度 汇报 . 


1.72 表 1.14 显示 美国 1988 一 1995 年 ,每 100 000 个 居民 中 的 犯罪 率 .根据 数据 , 作 两 种 类 型 的 图 . 


表 1.14 
年 份 1988 1989 1990 1991 1992 1993 1994 1995 
每 100 000 
个 居民 中 的 | 5 664.2 5 741.0 5 820.3 5 897.8 5 660.2 5 484.4 5 373.5 5 277.6 
犯罪 率 
来 源 : 美 国联 邦 ; 





1.73 表 1.15 显示 了 1997 年 7 个 人 口 最 多 的 国家 的 人 口 数 . 用 圆 形 图 来 说 明 7 个 人 口 最 多 国家 的 人 口 情 
me. 
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来 源 ; 美 国人 口 调查 局 ,国际 资料 总 部 . 


方程 


1.76 


1.77 


1.80 


Pareto 图 中 的 条 带 是 根据 频率 值 而 决定 的 .因此 最 高 的 条 带 在 左边 , 最 低 的 条 带 在 右边 .为 表 1.15 的 
数据 建 芯 一 个 Pareto 图 . 
表 1.16 显示 了 世界 上 各 大 洋 的 面积 ( 百 万 平方 英里 ) .根据 数据 , 做 (a) 条 形 图 ;(b) 圆 形 图 . 





解 下 列 方程 : 
(а)16 – 5с= 36; (4)3(20 +1) = 5(3- U)+3(U -2); 
(b)2Y-6=4-3Y; (e)3[2(X +1)-4]=10-5(4-2X); 
(c)4(X ~ 3) –11=15-2(Х +4); (0 (2/5) (12+ Үү) =6- (1/4) (9- Y). 
解 下 列 联 立 方程 : 
(а)2а + Б = 10 (е) 2а +5 - с= 2 

7а ~ 3р = 9; За - 46 +2с= 4 

4а - ЗЬ - 5с= – 8; 

(b)3a + 55 = 24 ({)SX+2Y+3Z= -5 

2a +3Ь= 14; 2X-3Y-6Z=1 
(c)8X-3Y=2 X+5Y-4Z=22; 

3X+7Y= -9; (g)3U-SV+6W=7 
(d)5A -9B= -10 SU+3V-2W= -1 

ЗА -4B=16; 4U -8V +10W=11. 
(a) 在 同一 坐标 系 中 做 出 方程 SX+2Y=4 和 7X-3Y=23 的 图 像 ， 
(b) 从 图 像 中 求 联 立 方程 的 解 ; 


(c) 用 (a) 和 (b) 的 方法 求 习 题 1.77 中 (a) 一 (d) 的 解 . 

(a) 用 习题 1.61(a) 的 图 像 解 方程 2X2+ XX-10=0( 提 示 ; 抛 物 线 与 久 轴 的 交点 的 模 坐 标 即 为 方程 的 
Ж); 

(b) 用 (a) 的 方法 解 3X2-4X-5=0. 


— -bt Vb- 
二 次 方程 aX? + bX + c=0 解 的 公式 为 多 二 04а 用 公式 解 (a)3X? -4Х-5=0,(Ь)2Х? + 
X - 10= 0, (с)5Х? + 10Х =7,(4)Х?+8Х +25=0. 


不 等 式 


1.81 
1.82 


1.83 


按 要 求 排列 数字 - 4.3, -6.15,2.37,1.52 和 -1.5. (a) 升 序 排列 ;(b) 降 序 排列 . 
用 不 等 号 表达 下 列 各 式 . 

(а) FER N 介 于 30 一 50 之 间 ( 包 括 30 及 50), 

(b) ~I RTRA S 不 小 于 7; 

(с) X 大 于 等 于 -4 但 小 于 3; 

(d) 已 最 多 为 5; 

(e) XX 至少 比 Y 大 2. 

解 下 列 不 等 式 : 


(а)3Х2>12; (е) -31(2Х + 1)<3; 
(Ь)4Х<5Х 3; (00< 2-(15-5№)<и2; 


(с)2№+15>10+3№; (8) -2<3+ $ (la -12)<8. 
(d)3+5(Y -2)<7-3(4- Y); 


对 数 和 反对 数 


1.84 求 下 列 各 数 的 常用 对 数 : 
(a)387; (ce)0.0792; (е)0.6042; (g)476.3; (1)7.146;  (k)0.00098; 
(Ъ)0.387; (d)14 630; (0)0.002795; (Һ)1.007; G)71.46; (1)84 620 000. 
1.85 求 下 列 各 数 的 反对 数 ， 
(a)3.5611; (с)1.7045; (е)2.4700; (в)2.8003; (:)0.0800; 
(9.8293 – 10; (4)8.9266 — 10; (Р)6.4700 - 10; (Һ)3.7072; ‚_ 0)6.3841. 
1.86 用 对 数 计算 下 列 各 式 的 值 : 


(а)783.6х 1654; (0.04182 х / 0.6758; 
21.7 | этәр. 
(b)378 5 (g) / 3728; 
(с) £24556 624.1. (h) 751.63 х 33.81х47.53х63,28х 87.47; 


14.32 x 0.003572’ 


(d)1.562!5; со | 4720.005745, 
(е)9-3854*<12.4в?, (3)_3:781 у 43-25 50.08743- 
0.04382 0.01873Y 0.002356 x 6.824 
1.87 作出 (a)Y=logX 和 (b)Y=10x 的 图 像 ,并 讨论 它们 的 相似 性 . 
1.88 改写 下 列 方程 ,使 之 不 出 现 对 数 :(a)2logX - 3logY = 2, (b)logY +2X = log3. 
1.89 Ша? = №, Фар 是 正 数 且 4 关 1, 我 们 称 p 是 以 a DEN 的 对 数 , 记 作 p = log,N. 求 (a)log,8， 
(b)log2s125, (c)log41/16, (d)log1/,232, (e)logs1. 


1.90 证 明 : 近 似 地 ,log.N =2.303 logioN, 其 中 e=2.71828… 称 为 对 数 的 自然 基底 . N >0. 
1.91 WEH (loga ) (108,6) =1, EP a >0, b >0, a1, 651. 


第 二 章 频数 分 布 


原始 数据 


原始 数据 是 收集 来 的 没 经 过 整理 的 数据 . 比如 从 一 个 大 学 按 字母 排列 的 名 单 上 抽取 到 的 
100 个 男 同 学 的 身高 是 一 组 原始 数据 . 


数组 阵列 


数组 阵列 是 原始 数据 按 数 量 大 小 升序 或 降序 排列 的 序列 .数据 中 最 大 值 与 最 小 值 的 差 称 
为 数据 的 全 距 . 例 如 , 如果 100 个 男 同 学 中 身高 最 高 为 74 英寸 , 最 低 为 60 英寸, 则 全 距 为 
74—60 = 14 英寸 . 


频数 分 布 


当 汇 总 大 量 的 原始 数据 时 , 把 数据 按 类 型 分 组 会 带 来 方便 .其 中 每 个 组 的 数据 个 数 , 称 为 
组 频数 . 表示 各 组 及 它们 对 应 的 组 频数 的 表格 称 为 频数 分 布 或 频数 表 . 表 2.1 就 显示 了 XYZ 
大 学 100 个 男 同 学 身高 的 频数 分 布 ( 记 录 至 最 近 的 英寸 ). 


表 2.1 XYZ 大 学 100 个 男 同 学 的 身高 


身高 (英寸 ) | 学 生 数 
60— 62 5 
63—65 18 
66 — 68 42 
69 — 71 27 
72—74 8 

总 数 100 


例如 ,第 一 组 由 60—62 英寸 的 身高 构成 ,用 符号 60—62 表示 .由 于 有 5 个 学 生 的 身高 属 
于 这 一 组 , 因此 这 一 组 的 组 频数 是 5. 

在 上 述 频 数 分 布 中 , 经 过 整理 和 汇总 的 数据 称 为 分 类 资料 .尽管 在 归 组 过 程 中 数据 的 许多 
БАЛА БЛ ТИЛЕ, 然而 我 们 却 对 数据 的 整体 情况 有 了 清楚 的 了 解 , 而 且 数 据 之 间 的 相互 关系 
也 一 目 了 然 . 


组 距 和 组 限 


用 来 定义 某 一 组 的 符号 , 称 为 组 距 , 如 表 2.1 中 60 一 62 .两 端的 数 60 和 62, 称 为 组 限 , 其 
中 较 小 的 数 (60) 称 为 下 组 限 , 较 大 的 数 (62) 则 称 为 上 组 限 .尽管 组 距 实 际 上 只 是 组 的 符号 ,但 
组 和 组 距 在 使 用 中 常 可 互相 代替. 

从 理论 上 说 ,一 个 没有 上 组 限 或 下 组 限 的 组 距 称 为 开 组 距 . 例如 , 考虑 成 年 人 的 年 龄 . 组 距 
“65 及 65 岁 以 上 ”就 是 一 个 开 组 距 . 
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如 果 身 高 记录 至 最 近 的 英寸 ,那么 组 距 60—62 理论 上 包括 了 从 59.5000 到 62.5000 英寸 
的 所 有 测量 值 .这 些 数 简单 地 记 为 精确 数 59.5 和 62.5, 并 称 为 组 界 或 真实 组 限 , 其 中 较 小 的 


数 (59.5) 称 为 下 组 者 , 较 大 的 数 (62.5) 称 为 上 组 窜 . 
在 实际 中 ,组 界 可 以 由 一 个 组 距 中 的 上 组 限 和 较 高 一 级 组 距 中 的 下 组 限 相 加 除 以 2 而 得 . 
有 时 也 用 组 界 来 标记 不 同 的 组 . 比如 , 表 2.1 中 第 一 列 的 不 同 组 就 可 用 59.5 ~ 62. 5, 
62.5 一 65.5 等 等 来 表示 .为 了 避免 在 使 用 中 出 现 意 义 不 明 确 的 情况 ,组 界 不 应 与 实际 观察 值 一 
致 .因为 如 果 一 个 观察 值 为 62.5, 那么 就 不 容易 判断 是 属于 组 距 59.5 62.5, 还 是 属于 组 距 
62.5~65.5. 


组 距 的 大 小 或 宽度 


组 距 的 大 小 或 宽度 是 上 下 组 界 的 差 ,也 常 称 为 组 宽 . 如 果 一 个 频数 分 布 的 所 有 组 距 都 有 同 
样 的 宽度 , 那么 这 个 共同 的 宽度 用 с 来 表示 .在 这 种 情况 下 , c 等 于 2 个 连续 下 组 界 或 2 个 连 
续 上 组 界 的 差 .在 表 2.1 中 ,c=62.5-59.$=65.5-62 5=3. 


组 中 值 


组 中 值 是 组 距 的 中 点 , 可 以 由 上 下 组 限 的 和 除 以 2 得 到 .因此 ,60 一 62 的 组 中 值 为 (60 + 
62)/2=61. 组 中 信也 称 为 组 中 点 . 

为 了 深入 地 进行 数学 研究 ,我 们 常 假定 一 个 给 定 组 距 的 所 有 观察 值 都 与 组 中 值 是 一 致 的 ， 
因此 ,组 距 60—62 英寸 中 所 有 身高 都 视 为 61 英寸 


建立 频数 分 布 的 一 般 法 则 


1. 找 出 原始 数据 中 的 最 大 值 和 最 小 值 , 并且 求 出 全 距 ( 即 最 大 值 与 最 小 值 的 差 )， 

2. 把 全 距 按 组 的 宽度 一 致 原则 恰当 地 分 组 .如 果 这 样 不 可 行 ,那么 就 分 成 宽度 不 同 的 组 
或 开 组 距 (见习 题 2. 12) .组 距 数目 根据 数据 情况 通常 取 5—20 之 间 . 选择 组 距 时 ， 也 要 注意 组 
中 值 (或 组 中 点 ) 与 实际 观察 数据 应 一 致 .这 是 保证 在 进一步 的 数学 研究 中 , 所 谓 的 分 组 误差 减 
少 到 最 小 .然而 , 组 界 不 应 与 实际 观察 数据 一 致 . 

З. 求 出 落 入 每 个 组 距 中 的 观察 值 数 目 , 即 求 出 组 频数 .这 些 最 好 用 计数 完成 (见习 题 
2.8). 


直方 图 和 频数 多 边 形 


直方 图 和 频数 多 边 形 是 频数 分 布 的 两 种 图 表 表 示 形 式 . 

1. 一 个 直方 图 或 频数 直方 图 由 一 组 满足 以 下 条 件 的 矩形 构成 .(a) 以 水 平 轴 (X 轴 ) 为 底 ， 
中 心 在 组 中 值 且 宽 度 等 于 组 距 宽度 ;(b) 面 积 大 小 与 组 频数 成 比例 . 

如 果 所 有 组 距 都 有 同样 的 宽度 ， 那么 矩形 的 高 与 组 频数 成 比例 , 习惯 上 , 就 把 高 度 视 为 组 
频数 .如果 组 距 的 宽度 不 同 , 那么 就 要 调整 矩形 的 高 度 (见习 题 2 13). 

2. 频数 多 边 形 是 关于 组 频数 的 线形 图 , 依据 组 中 值 而 得 在 直方 图 中 把 相 邻 两 矩形 上 底 
中 点 用 直线 连接 起 来 就 可 以 得 到 频数 多 边 形 . 

根据 表 2. 1 中 身高 的 频数 分 布 而 相应 作出 的 直方 图 或 频数 多 边 形 ,如 图 2.1 所 示 . 习惯 
上 , 常 加 上 延长 部 分 PQ 和 RS, 其 中 和 S 分 别 为 第 一 组 之 前 一 组 的 组 中 值 和 最 后 一 组 之 后 
一 组 的 组 中 值 , 而 它们 相应 的 组 频数 为 0. 在 这 种 情况 下 ， 直方 图 中 矩形 的 面积 和 等 于 频数 多 
边 形 和 X 轴 围 成 区 域 的 总 面积 (见习 题 2.11). 


频率 分 布 


“个 组 的 频率 (相对 频数 ) 或 百分率 频数 是 这 个 组 的 频数 除 以 所 有 组 的 总 频数 而 得 的 数 
值 ,通常 用 百分数 表示 .例如 , 表 2.1 中 65 一 68 这 一 组 的 频率 为 42/100 = 42%. 显然 , 所 有 组 
的 频率 之 和 为 1, 100%. 

WRR 2.1 中 的 频数 用 相应 的 频率 来 替换 ， 则 所 得 的 表 称 为 频率 分 布 , 百分率 分 布 或 频率 


学 生 数 〈 频 数 ) 





ж. 

只 要 在 竖 轴 上 把 频数 改 为 频率 且 保 持 图 不 变 , 就 可 以 从 直方 图 或 频数 多 边 形 中 得 到 频率 
分 布 的 图 像 表示 .所 得 的 图 像 分 别称 为 频率 直方 图 (或 百分率 直方 图 ) 和 频率 多 边 形 (或 百分率 
多 边 形 ). 


容积 频数 分 布 和 旷 形 线 


一 个 给 定 组 距 中 所 有 小 于 其 上 组 界 的 值 的 总 频数 称 为 直到 和 且 包 括 此 组 距 的 累积 频数 . 例 
如 , 表 2.1 中 直到 且 包 括 组 距 66—68 英寸 的 累积 频数 为 5+ 18 + 42 = 65, 这 意味 着 有 65 个 学 
生 的 身高 低 于 68.5 英寸. 

描绘 累积 频数 的 表 称 为 累积 频数 分 布 或 累积 频数 表 , 简称 为 累积 分 布 , 表 2.2 即 是 表 2 .1 
中 学 生 身 高 的 累积 频数 表 . 

依据 上 组 界 来 描绘 的 累积 频数 低 于 上 组 界 的 图 形 称 为 累积 频数 多 边 形 或 卵 形 线 , 如 图 2_2 
所 示 . 





表 2.2 
100 

身高 (英寸 ) 学 生 数 
ү ————— 80 

小 于 59.5 0 
m НН 

小 于 62.5 5 #60 
| RS 

小 于 65.5 23 40 
-一 一 一 L 

小 于 68.5 65 20 
一 一 一 一 一 一 一 全 一 一 一 一 一 一 

小 于 71 5 92 

595 625 655 685 715 745 
小 于 74.5 100 身高 (英寸 》 


图 2-2 


有 时 为 了 某 种 应 用 , 需要 考虑 所 有 大 于 或 等 于 各 组 下 组 界 的 值 的 累积 频数 分 布 . 因 为 在 这 
ЕЛУ Н Н, 我 们 考虑 59.5 英寸 或 更 高 , 62.5 英寸 或 更 高 等 等 ， 有 时 这 被 称 为 “不 低 于 ”累积 分 
布 ,而 前 面 考虑 的 是 “ 低 于 ”累积 分 布 . 从 一 个 出 发 很 容易 就 得 到 另 一 个 (见习 题 2. 15). 对 应 的 
卵 形 线 称 为 “不 低 于 "和 “ 低 于 ” 卵 形 线 .车 没有 特别 声明 ,一般 指 的 是 “ 低 于 "类 型 


峻 积 频率 分 布 和 百分率 卵 形 线 
案 积 频率 或 百分率 累积 频数 , 由 累积 频数 除 以 总 频数 而 得 .例如 , 身高 低 于 68.5 英寸 的 累 


积 频率 为 65/100=65% ,也 就 是 说 ,65% 的 学 生 吴 高 低 上 68.5 英 寸 . 
在 表 2.2 和 图 2-2 中 用 累积 频率 来 葵 代 累积 频数 ,就 能 分 别 得 到 暴 积 频率 分 布 (或 百分率 
轮 积 分 布 ) 和 凤 积 频率 多 边 形 ( 或 百分率 卵 形 线 ). 


频数 曲线 和 光滑 卵 形 线 


收集 到 的 数据 通常 认为 是 从 较 大 总 体 中 抽取 一 个 样本 获得 的 .由 于 总 体 里 有 许多 可 观察 
НЕ, 从 理论 上 说 (对 于 连续 数据 ) 可 以 选择 较 小 的 组 距 并 且 仍 然 有 相当 多 的 观察 值 落 入 每 个 
组 距 中 .因此 对 于 较 大 总 体 我 们 希望 将 频数 多 边 形 或 频率 多 边 形 的 折线 段 近似 地 连 成 曲线 ,我 
们 分 别称 之 为 频数 曲线 或 频率 曲线 . 

理论 上 的 这 种 曲线 可 通过 使 样本 的 频数 多 边 形 或 频率 多 边 形变 光滑 而 近似 得 到 , 样本 容 
量 增加 ,近似 程度 也 将 得 到 改善 .也 由 于 这 个 原因 ,频数 曲线 有 时 也 称 为 光滑 频数 多 边 形 . 

同样 地 ,使 察 积 频数 多 边 形 或 卵 形 线 变 光滑 就 可 以 得 到 光滑 卵 形 线 . 通常 ,使 卵 形 线 变 光 
消 要 比 使 频数 多 边 形变 光滑 要 容易 些 (见习 题 2.18)， 


频数 曲线 的 种 类 
在 实际 中 产生 的 频数 曲线 呈现 出 菜 些 特有 的 形状 , 如 图 2-3 所 示 . 


AAA 


对 称 或 钟 形 向 右 偏 《 正 偏 度 )》 四 左 偏 〈 负 偏 度 ) 


мм 


图 2-3 


1. 当 本 中 心 最 大 值 等 距离 的 两 边 的 观察 值 有 相同 的 频数 时 ， 出 现 对 称 的 或 钟 形 的 频数 曲 
线 , 正 态 曲 线 是 重要 代表 . 

2. 在 微 不 对 称 的 或 斜 的 频数 曲线 中 , 曲线 一 侧 相对 于 中 心 最 大 值 的 尾部 较 另 一 侧 的 要 长 ， 
如 采 长 的 尾部 落 在 右边 ,这 样 的 曲线 称 为 向 右 偏 或 者 说 曲线 有 正 偏 度 ; 反之 ， 曲线 称 为 向 左 偏 
或 者 说 曲线 有 负 偏 度 . 

3. 在 J- 形 或 反 J - 形 曲线 中 , 最 大 值 落 在 一 端 . 

4. U - 形 频 数 曲线 的 两 端 都 可 取 到 极 大 值 . 

5 .一 条 双 峰 频数 曲线 有 两 个 极 大 值 . 

6. 一 条 多 峰 频 数 曲线 有 多 于 两 个 的 极 大 值 . 


习题 及 解答 


数组 阵列 


2.1 


2.2 


(a) 排 列 数据 17, 45, 38, 27,6,48,11,57, 34 和 22. 

(b) 求 这 些 数 的 全 距 . 

和 解 ”Q 和 (a) 按 数量 大 小 升序 排列 为 :6,11,17,22,27, 34,38,45, 48,57. 降序 排列 为 :57, 48, 45, 38, 34， 

27, 22, 17, 11,6. 

(b) 由 于 最 小 值 为 6, 最 大 值 为 57, 所 以 全 距 为 57 -6= 51. 

州立 大 学 80 个 学 生 的 数学 学 期 成 绩 记 录 在 下 表 中 
68 84 75 82 68 90 62 88 76 93 
73 79 88 73 60 93 71 59 85 75 
61 65 75 87 74 62 95 78 63 72 
66 78 82 75 94 77 69 74 68 60 
96 7E 89 61 75 95 60 79 83 71 
79 62 67 97 78 85 76 65 71 75 
65 80 73 57 88 78 62 76 53 74 
86 67 73 81 72 63 76 75 85 77 


根据 此 表 , 求 : 

(a) 最 高 分 ; 

(b) RRI; 

(с) Р; 

(4) 前 5 名 的 成 绩 ; 

(e) 后 5 名 的 成 绩 ， 

(7) 第 10 名 的 成 绩 ; 

(в) 成 绩 不 低 于 75 的 学 生 人 数 ，; 

(h) 成 绩 低 于 85 的 学 生 人 数 ; 

G) 成 绩 介 于 65 到 85 之 间 的 学 生 所 占 的 比例 ; 

G) 没有 出 现 的 成 绩 . 

解 S 其 中 的 一 些 问题 是 很 具体 的 ,因此 我 们 最 好 先 建立 一 个 数组 阵列 .把 数据 分 为 具体 的 组 , 每 
个 数据 填 入 相应 的 组 , 如 表 2.3, 称 为 一 个 登记 表 . 然后 对 每 一 组 数据 进行 排列 , 如 表 2.4, 就 能 得 到 我 
们 需要 的 数组 阵列 .根据 表 2.4 我 们 就 可 以 较 容易 地 解答 上 述 问题 


表 2.3 






53 






55 ~ 59 59, 57 

60—64 62,60, 61, 62, 63, 60, 61, 60, 62, 62, 63 

65 — 69 68, 68, 65, 66, 69, 68, 67, 65, 65, 67 

70—74 73, 73,71,74, 72,74,71, 71,73,74, 73,72 

75 ~ 79 75,76, 79, 75, 75, 78, 78,75,77, 78,75,79, 79, 78,76, 75,78, 76,76,75, 77 
80—84 84, 82, 82, 83, 80, 81 

85—89 88,88,85,87,89,85,88,86,85 

90 一 94 90, 93, 93, 94 













60—64 60, 60, 60, 61,61, 62,62, 62,62, 63, 63 

65—69 65, 65, 65, 66, 67, 67, 68, 68, 68, 69 

70—74 71,71,71,72,72, 73, 73,73,73, 74,74,74 

75 ~ 79 75,75, 75, 75,75, 75, 75, 76, 76, 76, 76,77,77, 78,78, 78, 78,78, 79, 79, 79 
80 — 84 80, 81, 82, 82, 83, 84 





‚87, 88 





‚88,88,89 


(а) 最 高 分 是 97; 

(b) 最 低 分 是 53; 

(с) 全 中 是 97- 53-44; 

(d) 前 5 名 的 成 绩 为 97,96,95,95 和 94; 

(е) 后 $5 名 的 成 绩 为 53, 57, 59, 60 和 60; 

(0) 第 10 名 的 成 绩 为 88; 

(g) 成 绩 不 低 于 75 的 学 生 人 数 为 44; 

(h) 成 绩 低 于 85 的 学 生 人 数 为 63; 

(1) 成 绩 介 于 65 到 85 之 间 的 学 生 所 占 的 比例 是 49/80 = 61.2%: 

Qj) 没有 出 现 的 成 绩 是 0—52,54,55, 56, 58,64,70,91,92,98,99 和 100. 


频数 分 布 , 直方 图 和 频数 多 边 形 


2.3 表 2.5 给 出 了 PERAR 65 个 员工 周 薪 的 频数 分 布 .根据 表 2.5 Ж. 
(а) 第 六 组 的 下 限 ; 
(b) 第 四 组 的 上 限 ; 
(с) 第 三 组 的 组 中 值 ; 
(d) 第 五 组 的 组 界 ; 
(e) 第 五 组 组 距 的 大 小 ; 
(Р) 第 三 组 的 频数 ， 
(в) 第 三 组 的 频率 ; 
(h) 频数 最 大 的 组 距 .这 通常 称 为 众 数组 , 它 的 频数 称 为 众 数组 频数 ; 
(1) 周 薪 低 于 280.00 美元 的 员工 比例 ; 
(3) 周 薪 介 于 260.00 一 300.00 美 元 之 间 的 员工 比例 . 


表 2.5 

工 资 (美元 ) 职工 数 
250.00—259.99 8 
260.00 一 269.99 10 
270.00 一 279.99 16 
280.00—289.99 14 
290.00 一 299.99 10 
300.00 一 309.99 5 
310.00 一 319.99 2 

总 计 65 


ЯФ EF (a)300.00 美元 . 
(b)289.99 美元 . 


2.4 


2.5 


2.6 


(с) 第 组 的 组 中 值 为 六 х (270.00+279.99) = 274.995. 空 际 应 用 中 , 舍 入 至 275.00 美 元 . 


., „лш у. 1 
(d) BEARTAIS x (290.00 + 289.99) = 289.995 .第 五 组 的 上 组 界 为 > x (299.99 + 300.00) 
= 299.995. B 
(е) 第 五 组 组 距 的 大 小 = 第 五 组 的 上 组 界 - 第 五 组 的 下 组 界 =299.995 — 289.995 = 10.00 美元 .在 此 
列 中 ,所 有 组 距 有 相同 的 大 小 ;10.00 美元 . 
({) 16. 
(g) 16/65 =0.246= 24.6%. 
(Ь)270.00 — 279.99. 
(1) ЖИК 280.00 美元 的 职工 人 数 是 16+ 10+8= 34. ЕЕ 280.00 美元 的 职工 比例 为 34/65 = 


52.3%. 
G) Ж] ЛГ 上 260.00 -300.00 关 元 之 问 的 职 上 人 数 是 10+ 14+ 16+ 10=50. 周 薪 介 于 260.00 一 


300.00 大 正之 间 的 职 上 比例 为 50/65= 76.9%. 
如 末 在 学 生体 重 的 频数 分 布 中 , 组 中 值 分 别 为 128, 137, 146, 155,164,173 和 182 磅 , 求 : 
(a) 组 距 大 小 ;(b) 组 界 ;(c) 组 限 ,假定 所 有 体重 值 均 侈 入 至 最 近 的 磅 数 . 


Ж ЮР (а) 组 距 大 小 = 连续 组 中 值 的 共同 差 = 137- 128= 146 137 二 … -= 9 8. 
(b) 由 于 组 距 有 相同 的 大 小 , 因此 组 界 是 组 中 信和 间 的 中 点 , 值 为 X (128 + 137), + x (137 + 146)，…， 


УХ (173+182), 即 132.5,141.5,150.5,…,177.5 磅 .由 于 共同 的 组 距 大 小 为 9 磅 , 因此 第 一 组 的 下 
组 界 是 132.5- 9=123.5, 最 后 一 组 的 上 组 界 是 177.5+9= 186.5. 所 以 所 有 的 组 界 分 别 为 :123. 5, 
132.5,141.5,150.5,159.5,168.5,177.5,186.5 磅 . 

(с) 由 于 组 限 是 整数 , 我 们 选择 最 靠近 组 界 的 整数 , 即 , 123, 124, 132, 133,141, 142,… .因此 第 一 组 的 组 
限 为 124 一 132, 下 一 组 的 组 限 为 133 一 141, 以 此 类 推 . 

用 图 表示 习题 2.4 的 结果 . 


H Бє 


l l 
І і і 
І | l | l 1 
123.5 132.5 141.5 150.5 159.5 168.5 177.5 186.5 


如 上 图 所 示 . 组 中 值 128, 137,146, …, 182 均 标 在 X 轴 上 .组 界 用 长 的 垂直 虚线 表示 ,组 限 由 长 的 垂直 
150 个 测 基 值 的 最 小 值 为 5.18 英寸 , 最 大 值 为 7.44 英寸. 求 一 组 可 用 于 建立 频数 分 布 
的 恰当 的 (a) 组 距 , (b) 组 界 , (c) 组 中 值 . 

解 EF 全 距 为 7.44-~ 5.18=2.26 英寸 .如 果 定 为 5 个 组 距 , 组 距 大 小 约 为 2.26/5 =0.45; 如 果 定 为 


20 个 组 距 , 组 距 大 小 大 约 为 2.26/20 =0.11.Ж 0.11 到 0.45 之 间 选 择 恰当 的 组 距 大 小 为 0.20,0.30 
或 0.40. 


(а) EFFI, П, 亚 分 别 表示 组 距 大 小 为 0.20.0.30 和 0.40 的 恰当 组 距 . 


I H i 
5.10~5.29 5.10—5.39 5.10~5.49 
5.30~5.49 5.40~5.69 5,50—5.89 
5.50-—5.69 5.70—5.99 5.90—6.29 
5.70~5.89 6.00~6.29 6.30~6.69 
5.90 一 6.09 0.30 一 6.59 6.70—7.09 
6.10-—6.29 6.60 —6.89 7.10-—7.49 
б 30-— 6.49 6.90~7.19 
6 50-— 6.69 7.20 一 7.49 
6.70—6.89 
6.90-—7.09 
7.10~7.29 
7.30 一 7.49 


2.7 


2.8 


2.9 


注意 每 -- 列 第 一 组 的 下 组 限 可 以 不 为 5.10, 比如 ,如 果 我 们 取 5.15 作为 第 I 列 第 一 组 的 下 组 限 , 则 第 
一 组 应 写 为 5.15-~-5.34. 
(b) 1, П, 下 列 对 应 的 组 界 分 别 为 


І 5.095 — 5.295, 5.295 ~ 5.495, 5.495 — 5.695, ··-, 7.295 7.495 
l 5.095 ~ 5.395, 5.395 ~ 5.695, 5.695 — 5.995, -:·,7.195-— 7.495 
Ш 5.095 ~ 5. 495, 5.495 ~ 5.895, 5.895 — 6.295, ··., 7.095 — 7.495 


由 于 它们 与 测 基 值 不 一 致 , 因此 这 些 组 界 是 恰当 的 . 
(с), П, ШУЛУУН И у 


І 5.195, 5.395, ···, 7. 395 
[| 5.245,5.545,-,7.345 
Ш 5.295, 5.695, ···, 7.295 


这 些 组 中 值 存在 与 测量 值 不 一 致 的 缺陷 . 

在 解答 习题 2.6(a) 时 ,一 个 学 生 选 择 了 组 距 5.10—5.40,5.40— 5.70, …,6.90 一 7.20 和 
7.20~7. 50. 请问 这 样 选择 有 问题 吗 ? 

МО F 这 些 组 距 在 5.40,5.70,…,7.20 的 点 处 出 现 重 到 的 现象 .因此 一 个 测量 值 比如 5.40, 就 可 以 
放 在 前 后 两 组 的 任何 一 组 里 .一 些 统计 学 家 通常 选择 把 这 些 模 楼 两 可 的 数据 一 半 放 在 其 中 一 组 , 另 一 
半 放 在 另 一 组 . 

这 种 不 确定 的 情况 可 以 通过 把 组 距 写 为 5.10 到 低 于 5.40, 5.40 到 低 于 5.70 等 而 得 到 改善 .此 

时 , 组 限 与 组 界 一 致 ,组 中 值 与 测量 值 一 致 . 

通常 地 ,应 尽 可 能 避免 重合 现象 的 发 生 , 并且 组 界 应 与 实际 观察 值 不 一 致 .例如 , 为 了 避免 习题 2.6 

的 组 距 产 生 不 确定 的 情况 , 组 距 应 选 为 5.095 一 5.395, 5.395 — 5.695, 等 等 .但 是 , 这 种 特殊 的 选择 会 
造成 组 中 值 与 观察 数据 不 一 致 . 

下 表 记 录 了 州立 大 学 40 个 田 同学 的 体重 ( 舍 入 至 最 近 的 磅 数 ), 建立 频数 分 布 . 

138 164 150 132 144 125 149 157 
146 158 140 147 136 148 152 144 
168 126 138 176 163 119 154 165 


146 173 142 147 135 153 140 135 
161 145 135 142 150 156 145 128 


М F 最 大 体重 值 为 176 磅 0) , 最 小 体重 值 为 119 磅 ,因此 全 距 为 176~~119= 57 磅 .如 果 采 用 5 个 
组 距 , 那么 组 距 大 小 近似 为 57/5 = 11; 如 果 采 用 20 个 组 距 ， 那么 组 距 大 小 近似 为 57/20 = 3. 
组 距 大 小 选择 为 5 磅 会 显得 方便 些 . 这样, 组 中 值 可 选择 为 120， 125, 130, 135, … .因此 组 距 可 选择 
为 118 一 122, 123 一 127,128 一 132,…:; 组 界 为 117.5, 122.5, 127.5， =, 这 些 值 与 观察 值 不 一 致 . 
所 求 的 频数 分 布 如 表 2.6 所 示 . 中 间 一 栏 根据 原始 数据 把 组 频数 用 唱 票 形式 给 出 ， 称 为 计数 或 得 
分 单 ,在 最 后 的 频数 分 布 中 得 分 单 通常 省 略 . 
PM F 当然 ,存在 着 其 他 可 能 的 频数 分 布 .例如 , 表 2.7 给 出 了 7 个 组 , 组 距 为 9 磅 的 频数 分 布 . 
用 Minitab 建立 习题 2.8 体重 分 布 的 (a) 枝 叶 图 , (b) 直 方 图 . 
Ж EF Minitab 软件 产生 的 枝叶 图 如 图 2-4《a) 所 示 . 枝 叶 图 由 三 列 组 成 .第 二 列表 示 给 出 数据 的 枝 ， 
第 三 列表 示 这 些 数据 的 叶 . 第 一 行 1,11, 9 表示 数据 119 的 校 为 11, 叶 为 9. 第 二 行 1,12 表示 数据 120 
至 124 的 枝 为 12, 叶 为 0,1,2,3 或 4, 但 体重 数据 中 没有 这 几 个 数 ,因此 该 行 没有 叶 . 第 三 行 4, 12, 568 
表示 数据 125 至 129 的 枝 为 12, 叶 为 5,6,7,8 或 9. 体重 数据 表 中 只 有 125,126,128 三 个 数 ,因此 这 行 
的 叶 为 5,6,8. 余 下 各 行 类 似 .图 2-4(a) 的 第 一 列 在 第 七 行 的 (8) 以 上 数字 表示 从 第 一 行 开始 的 数据 累 
计 个 数 ,如 第 四 行 的 5 表示 不 大 于 134 的 数据 共有 5 个 ;第 七 行 (8) 以 下 的 数字 表示 从 个 数 第 一 行 开 始 


1) 1 磅 =0.453592 公斤 . 


的 数据 累计 个 数 , 如 倒数 第 三 行 的 4 表示 不 少 十 165 的 数据 共有 4 个 ;第 七 行 的 (8) 表 示 最 先 超 过 一 半 
数据 的 那 一 行 共有 8 个 数据 . 


ИТВ > Stem-and-Leaf ‘weight’. 


Character Stem-and-Leaf Dispiay 


Stem-and-leaf of weight М = 40 
Leaf Unit =1.0 


1 119 

1 12 

4 12 568 
5 132 


11 13 555688 
17 14 002244 
(8) 14 55667789 
15 15 00234 

10 15 678 

7 16 134 
4 16 58 
2 173 

1 176 





(а) (б) 


体重 ( 磅 ) 计数 


SA 
y% 


| 


118 ~ 122 
123~ 127 
128 ~ 132 
133 ~ 137 
138 ~ 142 
143 -— 147 
148 ~ 152 
153 ~ 157 
158 — 162 
163 ~ 167 
168 ~ 172 
173—177 








тача = O a O = a ч ч 





Мм кк шо N & © б С м м н 


— 









总 计 40 


表 2.7 
体重 ( 磅 ) 计数 频数 
118 — 126 下 
127 ~ 135 ЈЕ 
136—144 EF 
145—153 IE 正 T 12 
154 —~ 162 1Е l 
163—171 iF 
172—180 т 


总 计 40 


2.10 


2.12 


根据 习题 2.3 2.5, 57 (а) 77: OMR EH ЇЧ; (ORREN E; (аА) 20 
形 ;(e) 频 率 多 边 形 . 

解 Её (a) 在 表 2.5 的 频数 分 布 中 , 用 每 一 组 的 组 频数 除 以 总 频数 (65), 得 到 频 谈 分 布 ,结果 用 白 
分 数 表示 , 如 表 2.8 所 示 . 

(b) 和 (c) 频 数 直 方 图 和 频率 直方 图 如 图 2-5 所 示 . 注 意 , 把 一 个 频数 直方 图 转化 为 -个 频率 直方 图 只 
要 加 一 个 竖 直 标 度 表示 频率 ,如 图 2-5 的 右 侧 . 





表 2.8 











频率 (百分数 表示 ) 





250.00 一 259.99 1s a 

260.00 一 269.99 15.4 ч POR 29 
. ‚ 。 10 , т 4 і + ре мы, 

270.00— 279.99 24.6 А Ч uA 

280.00 ~ 289.99 21.5 Ыл. 汪汪 

290.00 一 299.99 15.4 2 

300.00 — 309.99 7.7 © 






310.00 — 319.99 





总 计 100.0 


(d) 和 (e) 在 图 2-5 中 用 虚线 表示 频数 多 边 形 和 频率 多 边 形 . 把 一 个 频数 多 边 形 转 化 为 一 个 频率 多 边 
形 ,只 需要 加 一 个 竖 直 标 度 表示 频率 . 

注意 , 如 果 只 需要 频率 多 边 形 ,那么 图 形 可 不 包含 直方 图 , 频率 轴 应 放置 在 左边 代替 频数 轴 . 
证 明 百 方 图 中 和 矩形 总 面积 等 于 相应 的 频数 多 边 形 和 X 轴 围 成 区 域 的 总 面积 ， 


WA es 假定 直方 图 由 3 个 矩形 构成 ,如 图 2-6 所 示 , 其 中 虚线 表示 相应 的 频数 多 边 形 . 





算 形 总 面积 = 阴影 面积 + 开 的 面积 + 的 面积 + V 的 面积 + 可 的 面积 

= 阴影 面积 + I 的 面积 + 亚 的 面积 + 克 的 面积 + 其 的 面积 

= 频数 多 边 形 和 X 轴 围 成 的 区 域 总 面积 
其 中 我 们 知道 工 的 面积 = 开 的 面积 , KER = NEE, У 的 面积 = 由 的 面积 , 三 的 面积 = 出 的 面 
积 . 
在 РЕВ 公司 (见习 题 2.3), 5 个 新 员工 的 周 薪 是 285 34 FJL, 316.83 美元 ,335.78 Æ 
JC, 356.21 美元 和 374.50 美元 . 对 这 新 老 70 个 职员 建立 频数 分 布 . 
E S 可 能 的 频数 分 布 如 表 2.9 所 示 . 

在 表 2.9(a) 中 , 相等 的 组 距 大 小 为 10.00 美元 . 因此， 有 许多 空 组 并 且 在 工资 标 度 的 尾部 细节 太 
多 . 

ER 2.9(b) 中 , 空 组 和 过 多 的 细节 通过 开 组 距 “320.00 美元 以 上 "的 使 用 而 避免 .这 样 做 的 不 利 
之 处 在 于 完成 某 些 数学 计算 时 , 表格 会 失去 效用 .例如 ,由 于 “320 00 关 元 以 上 "可 能 表示 了 个 人 每 周 
#19 1400.00 美元 ， 因此 就 不 可 能 确定 每 周 支 付 的 工资 总 数 . 

EX 2.9(c) 中 ,组 距 大 小 为 20.00 美元 . 它 的 不 利之 处 在 于 在 工资 标 度 的 前 面部 分 有 许多 信息 被 
忽略 掉 了 ,并 且 在 工资 标 度 的 尾部 细节 仍然 较 多 . 


在 表 2.9(d) 中 ,组 距 大 小 不 相等 . 它 的 不 利之 处 在 于 在 以 后 的 菜 些 数学 计算 中 ,不 如 组 距 大 小 相 
等 时 那么 简便 .组 距 愈 大 ,产生 的 误差 也 会 愈 多 . 


表 2.9(a) Ж 2.9(b) 







250.00 — 259. 


























250.00 -—259. 
260.00 ~ 269. 99 10 
270.00 — 279.99 16 260.00 — 269.99 10 
280.00 — 289. 99 15 270.00 279.99 16 
290.00 ~ 299.99 10 280.00 ~289. 99 15 
300. 00 — 309. 99 5 

290.00 299.99 10 
310.00 — 319.99 3 
320.00—329.99 0 300.00 — 309.99 5 
330. 00 — 339. 99 1 310.00 — 319.99 3 
340. 00 — 349. 99 0 320.00 以 上 
350. 00 ~ 359. 99 1 
360. 00 — 369. 99 0 
370.00 ~ 379. 1 





X 2.9(с) #2.9(4) 


工资 (美元 ) 
250.00~259.99 











250.00 ~269. 99 










270.00 — 289.99 


31 260.00 — 269.99 10 
290. 00 ~ 309. 99 15 270.00 — 279.99 16 
310.00 — 329. 99 3 280.00 — 289.99 15 
330. 00 ~ 349.99 1 290.00 一 299.99 10 
330.00 一 369.99 1 300.00 一 319.99 8 


370.00 一 389.99 320.00 一 379.99 






2.13 根据 表 2.9(d) 的 频数 分 布 建立 直方 图 . 


E E 所 求 直 方 图 如 图 2-7 所 示 . 为 了 建立 此 直方 图 ， 我 们 采用 面积 与 频数 成 比例 的 方法 .假定 矩 


形 A 对 应 第 一 组 ( 见 表 2.9(d)), 组 频数 为 8. 由 于 表 2.9(d) 的 第 六 组 也 有 频数 8, 代表 这 个 组 的 矩形 
В 也 应 该 有 着 与 А 相同 的 面积 .由 于 B 宽 是 A 宽 的 两 倍 , 因此 它 的 高 应 是 A 高 的 一 半 , 如 图 2-7. 
同 理 ,代表 表 2.9(4) 最 后 一 组 的 矩形 С, 在 竖 直 标 度 上 应 是 半 个 单位 高 . 


ридо АЙКАЙ а Бонер 


255 265 275 285 295 305 315 325 335 345 355 365 375 385 
工资 (美元 ) 


图 2-7 


毗 积 频数 分 布 和 卵 形 线 


2.14 根据 习题 2.3 表 2.5 的 频数 分 布 作 ; (a) 累 积 频 数 分 布 ;(b) 累 积 频 率 分 布 ;(c) 卵 形 线 ; 

(d) 百 分 率 卵 形 线 . 
Ж GG 和 (a) 和 (b) 累 积 频 数 分 布 和 累积 频率 分 布 如 表 2.10 所 示 . 

注意 第 二 列 每 行 的 值 是 把 表 2.5 的 第 二 列 相应 行 及 以 上 行 的 值 加 起 来 而 得 到 的 , 比如 18=8+ 
10, 34=8+ 10+ 16, 等 等 . 

第 三 列 的 每 一 个 值 是 把 前 一 列 的 值 除 以 总 频数 65 而 得 到 的 , 结果 表示 成 百分数 .比如 , 34/65 = 
52.3% .这 一 列 各 行 的 值 也 可 由 表 2.8 的 第 二 列 相应 行 及 以 上 行 的 值 加 起 来 得 到 .因此 ,27.7=12.3 
+15.4,52.3=12.3+15.4+24.6, 等 等 . 


2.10 
工资 (美元 ) 累积 频率 (百分数 ) 
低 于 250.00 0.0 
低 于 260.00 12.3 
低 于 270.00 27.7 
低 于 280.00 52.3 
低 于 290.00 73.8 
低 于 300.00 89.2 
低 于 310.00 96.9 
低 于 320.00 100.0 





(c) 和 (d) 卵 形 线 ( 或 累积 频数 多 边 形 ) 和 百分率 卵 形 线 分 别 如 图 2-8(a) 和 (b) 所 示 . 它们 均 是 由 Minitab 
产生 的 . 


70 


积 
& 
累积 频率 (百分数 ) 


т Th S 
250 260 270 280 290 300 310 320 250 260 270 280 290 300 310 320 
工资 (美元 ) 工资 (美元 》 


(a) (b) 
图 2-8 


2.15 根据 习题 2.3 表 2.5 的 频数 分 布 ,建立 :(a)“ 不 低 于 ”累积 频数 分 布 ; (b)“ 不 低 于 " 卵 形 
线 . 


E EF (a) 表 2.11 第 二 列 每 行 的 值 都 是 表 2.5 第 二 列 相应 行 及 以 下 行 的 值 的 和 ,开始 于 表 2 .5 的 


底部 , 比如 ,7=2+5,17=2+5+10, 等 等 .这 些 值 也 可 用 总 频数 65 减 去 表 2.10 第 二 列 相应 行 的 值 而 
得 到 , 比如 , 57=65-8,47=65-18, 等 等 . 
(b) 图 2-9 给 出 了 “不 低 于 ” 卵 形 线 . 


X 2.1! 





70 
[ 资 (美元 ) 
$ 60 
ЖАКЕ 250.00 65 EN 
A 50 
ЧЕ 260.00 57 W 40 
不 低 于 270.00 47 中 30 
ш 
不 低 于 280.00 31 长 20 
z 
不 低 于 290.00 17 10 
“6 300.00 7 
不 低 于 250 260 270 280 290 300 310 320 
不 低 于 320.00 0 





图 2-9 


2.16 根据 图 2-8 和 图 2-9( 分 别 关 于 习题 2.14 和 2.15) 的 卵 形 线 , 估计 满足 条 件 的 职工 人 


数 :(a) 周 薪 低 于 288. 00 美元 , (b) 周 薪 不 低 于 296. 00 美元 , (ec) 周 薪 介 于 263.00 到 
275.00 美元 之 间 . 


ЯЕ F (a) 根 据 图 2-8 的 “ 低 于 " 卵 形 线 , 作 一 条 竖 直 线 交 “工资 " 轴 于 288.00 美元 .这 条 线 交 卵 形 
线 于 点 (288, 45), 因此 ,45 个 职工 周 薪 低 于 288.00 美元 . 
(b) 根 据 图 2-9 的 “不 低 于 " 卵 形 线 , 作 一 条 竖 直 线 交 “工资 " 轴 于 296.00 美元 .这 条 线 交 卵 形 线 于 点 
(296,11), 因 此 ,11 个 职工 周 薪 不 低 于 296.00 美元 . 

此 结果 也 可 通过 图 2-8 的 “ 低 于 " 卵 形 线 得 到 .在 296.00 美元 处 作 竖 直线 , 我 们 发 现 54 个 职工 周 
薪 低 于 296.00 美元 , 因此 65—54= 11 个 职工 周 薪 不 低 于 296.00 美元 . 
(c) 根 据 图 2-8 的 “ 低 于 " 卵 形 线 , 得 到 :所 求职 工 数 = 周 薪 低 于 275.00 美元 人 数 - Ж {ЕЕ 263.00 
美元 人 数 =26 一 11= 15. 


上 述 结果 也 可 通过 累积 频数 表 的 线性 插值 得 到 . 例如 ,在 (a) 中 ,因为 288 = 280 + 8=280+ È x 
(290 — 280), 而 280 和 290 相对 应 的 累计 频数 分 别 为 34 和 48( 见 表 2.10), (48 -34) x ` = 11, 因此 
所 求人 数 为 34+11= 45. 
抛掷 5 枚 硬币 1000 次 , 每 次 抛掷 都 记录 下 正面 次 数 . 表 2.12 记录 了 正面 次 数 为 0, 1 
2,3,4 和 3$S 的 抛掷 次 数 . 

(а) 根据 表 2.12 的 数据 作 图 . 


表 2.12 (b) 建 一 个 表格 来 表示 正面 次 数 低 于 
抛 搓 次 数 (频数 ) 0,1,2,3,4,S5 或 6 的 抛掷 次 数 的 百 分 

比 . 

(с) 根据 (b) 中 表 的 数据 作 图 . 

解 ESF (a) 可 用 图 2-10 或 2-11 表示 

2.12 中 数据 的 情况 . 

由 于 正面 数 不 能 为 1.5 或 3.2, 因 此 图 
2-10 看 上 去 更 自然 .此 图 是 条 形 图 的 一 种 ， 
此 时 条 带宽 是 0, 有 时 也 把 这 样 的 图 称 为 杆 
图 . 遇 到 离散 数据 时 , 多 采用 此 图 形 . 

R 2-11 是 数据 的 直方 图 .注意 , 直方 图 的 总 面积 应 是 总 频数 1000. 在 作 直方 图 或 相应 的 频数 多 边 
ЖЕ, 我 们 通常 假定 数据 是 连续 的 .在 后 继 学 习 中 ,这 一 点 将 会 是 有 用 的 . 注意 , 我 们 在 习题 2.10 中 也 
已 对 离散 数据 作 过 直方 图 或 频数 多 边 形 . 

(уйт ЖЕП Ж 2.13 所 示 , 这 里 只 显示 正面 次 数 的 累积 频数 分 布 和 百分率 频数 分 布 .术语 “ 少 
Та", ЧУЕР 2" 等 等 应 理解 为 “ 少 于 或 等 于 0”, “ 少 于 或 等 于 1” 等 等 . 





300 300 
jg 250 250 
5 200 Ж 200 
Æ 150 5 150 

100 100 

50 
0 
0 12 3 4 5 
正面 次 数 
图 2- 10 





表 2.13 


抛掷 次 数 百 分 率 
(百分率 累积 频数 ) 





(c) 所 求 作 图 形 ,如 图 2-12 或 2-13 所 示 . 

由 于 正面 次 数 少 于 2 的 抛掷 次 数 所 占 百 分 率 等 于 正面 次 数 少 于 1.75,1.56 或 1.23 的 抛掷 所 占 百 
ЛЖ, 因此 对 这 些 值 来 说 ,百分率 都 等 于 18.2% (用 水 平 线 表 示 ). 因 此 ,图 2-12 用 来 显示 离散 数据 的 
情况 是 很 恰当 的 . 

图 2-13 显示 的 是 数据 的 累积 频数 多 边 形 或 卵 形 线 , 这 里 也 把 数据 看 做 连续 的 . 

图 2-12 和 2-13 分 别 对 应 (a) 中 的 图 2-10 和 2-11. 





100 100 
80 a 80 
Шш 60 60 
к Ёё 
ЖХ 40 z 40 
R Š 
和 20， 20 
0 1 2 3 4 5 
正面 次 数 
图 2-12 图 2- 13 
频数 曲线 和 光滑 卵 形 线 


2.18 从 XYZ 大 学 1546 个 男 同学 中 抽取 100 个 作为 一 个 样本 ( 表 2.1). 
(a) 根 据 样本 中 提供 的 数据 ,建立 一 个 光滑 百分率 频数 多 边 形 ( 频 率 曲线 ) 和 一 条 光滑 的 


“ 低 于 "百分率 卵 形 线 ， 
(b) 根 据 (a) 中 结论 , 估计 该 大 学 中 身高 在 65 一 70 英寸 之 间 的 学 生 数 .解决 这 个 问题 ,你 


需要 哪些 假定 ? 

(c) 你 能 根据 上 述 结 论 估 计 美 国 男 学 生 身 高 在 65—70 英寸 之 间 的 比例 吗 ? 

E F (a) 图 2-14 和 2-15 中 虚线 分 别 代表 的 是 从 图 2-1 和 2-2 中 得 到 的 频率 多 边 形 和 百分率 卵 
形 线 . 所 求 作 的 光滑 图 形 ( 黑 线 表示 ) 是 用 光滑 曲线 近似 它们 而 得 . 


频率 〈 百 分 数 ) 
S 









67 
身高 (英寸 ) 


图 2-14 


累积 频率 《百分数 ) 





59.5 325 655 685 715 74;5 
身高 (英寸 ) 


图 2- 15 


在 实际 应 用 中 ,因为 较 容易 得 到 光滑 百分率 卵 形 线 , 所 以 先 作 光滑 百分率 卵 形 线 ,再 从 其 上 读 取 
数值 得 到 光滑 频率 多 边 形 . 
(b) 如 果 100 个 学 生 的 样本 是 总 体 为 1546 个 学 生 的 代表 ,那么 图 2-14 和 2-. 15 的 光滑 曲线 可 假定 是 总 
体 的 频率 曲线 和 光滑 百分率 卵 形 线 .这 个 假定 仅 当 样本 是 随机 抽取 ( 即 每 个 同学 被 选择 的 机 会 是 相等 
的 ) 时 是 正确 的 . 
由 于 身高 在 65—70 英寸 之 间 实 际 上 代表 的 是 身高 在 64.5— 70.5 英寸 之 间 ， 因此 总 体 中 对 应 身 
高 的 学 生 所 占 的 百分比 可 通过 图 2- 14 中 阴影 部 分 面积 除 以 光滑 曲线 入 轴 围 成 的 面积 而 得 . 
用 图 2-15 会 更 简便 .从 图 中 我 们 看 出 ， 
HBF 70.5 英寸 的 学 生 所 占 百 分 比 =82% 
号 高 低 于 64.5 英寸 的 学 生 所 占 百分比 = 18% 
所 以 身高 在 64.5 一 70.5 英寸 之 间 的 学 生 所 占 百分比 =82% —18% =64%. 现在 可 知 , 在 XYZ 大 学 身 
高 在 65—70 英寸 之 间 的 学 生 数 是 1546 x 64% = 989 Л. 
这 也 可 由 概率 来 描述 , 即 从 1546 人 中 随机 抽取 的 学 生 身 高 在 65 一 70 英寸 之 间 的 概率 是 64% 或 
0.64. 由 于 与 概率 的 联系 ( 详 见 第 六 章 ), 相 对 频率 曲线 也 常 称 为 概率 曲线 或 概率 分 布 
(c) 仅 当 我 们 确信 抽取 的 100 个 学 生 的 样本 是 从 美国 所 有 男 学 生 总 体 中 随机 抽取 时 , 才能 认为 所 求 比 
例 是 64% (因此 ,这 个 比例 比 (b) 有 更 多 的 不 确定 性 ). 然 而， 由 于 某 些 原因 , 这 看 上 去 也 许 不 可 能 , 比 
如 :(1) 一 些 大 学 学 生 仍然 在 长 个 ， (2) 年 轻 一 代 比 他 们 的 父辈 要 高 等 等 
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补充 习题 


(a) 排 列 数据 12, 56, 42, 21, 5, 18, 10, 3, 61, 34,65 和 24;(b) 求 这 些 数据 的 全 距 . 














表 2.14 是 400 个 初中 生 每 周 看 电视 时 间 ( 以 分 钟 计 ) 的 频数 分 布 .根据 此 表 计 算 ; 
(a) 第 五 组 上 组 限 ; 

(b) 第 八 组 下 组 限 ; 表 2.14 

(c) 第 七 组 组 中 值 ; 观看 时 间 ( 分 钟 ) 

(d) 最 后 一 组 组 界 ; 300~ 399 

(e) 组 距 大 小 ; 400~ 499 46 
(f) 第 四 组 频数 ; 500~ 599 58 
(g) 第 六 组 的 频率 ; 600 一 699 76 
(h) 每 周 看 电视 时 间 不 超过 600 分 钟 700 一 799 68 
的 学 生 所 占 百 分 比 ; 800 一 899 62 
(i) 每 周 看 电视 时 间 多 于 或 等 于 900 900—999 48 
分 钟 的 学 生 所 占 百 分 比 ; 1000 一 1099 22 


(j) 每 周 看 电视 时 间 在 500— 1000 分 

钟 之 间 的 学 生 所 占 百分比 . 

根据 表 2.14 的 频数 分 布 建立 :(a) 直 方 图 ;(b) 频 数 多 边 形 . 

根据 习题 2.20 表 2.14 建立 :(a) 频 率 分 布 ;(b) 频 率直 方 图 ;(c) 频 率 多 边 形 . 

根据 表 2. 14 中 数据 建立 ; (a) 累 积 频数 分 布 ;(b) 百 分 率 累积 分 布 ;(c) 孵 形 线 ;(d) 百 分 率 卵 形 线 ( 除 非 

特别 说 明 , 累积 频数 是 在 “ 低 于 "基础 上 ). 

稼 积 频 数 在 “不 低 于 ”基础 上 解答 习题 2.23. 

根据 表 2.14 中 数据 , 估计 每 周 看 电视 ; (a) 少 于 560 分 钟 ;(b) 多 于 或 等 于 970 分 钟 ;(c) 在 620 一 890 分 

钟 之 间 的 学 生 数 . 

一 公司 生产 的 垫圈 内 直径 测量 至 最 近 的 干 分 之 一 英寸 .如果 这 些 直 色 频数 分 布 的 组 中 值 为 0.321, 

0.324,0.327,0.330,0.333,0.336, 求 (a) 组 距 大 小 ;(b) 组 界 ;(c) 组 限 

下 表 给 出 一 公司 生产 的 60 个 抽样 轴承 滚珠 直径 (以 厘米 计 ) .选择 适当 的 组 距 ,建立 直径 的 频数 分 布 . 
1.738 1.729 
1.728 1.737 


1100 — 1199 





743 1.740 1.736 1.741 1.735 1.731 
736 1.735 1.724 1.733 1.742 1.736 


1 .726 1.737 
1 
1.745 1.736 1.742 1.740 1.728 1.738 1.725 1.733 
1 
1 
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1 

1.739 1.735 

1.734 1.732 

1.733 1.730 732 1.730 1.739 1.734 1.738 1.739 1.727 1.735 

1.735 1.732 1.736 1.744 
1 


1.732 1.737 .730 1.740 


根据 习题 2.27 中 数据 建立 :(a) 直 方 图 ;(b) 频 数 多 边 形 ;(c) 频 率 分 布 ; (d) 频 率直 方 图 ;(e) 频 率 多 边 
形 ;(f) 累 积 频 数 分 布 ;(g) 百 分 率 累积 分 布 ;(h) 孵 形 线 ; (i) 百 分 率 卵 形 线 . 

根据 习题 2. 28 中 结论 ， 求 满足 下 列 条 件 的 滚珠 轴承 直径 的 百分比 ;(a) 超 过 1.732 cm;(b) 不 多 于 
1.736 ст; (с) Æ 1.730~1.738 cm 之 间 . 把 这 里 的 结论 与 从 习题 2.27 中 原始 数据 得 到 的 结论 作 比 较 ， 
利用 习题 2.20 中 数据 完成 习题 2.28. 

根据 美国 人 口 调查 局 最 新 人 口 报告 , 1996 年 美国 人 口 数 是 265 284 000. 表 2.15 给 出 不 同年 龄 组 的 百 
分 率 分 布 ， 

(a) 第 二 组 的 组 距 大 小 是 多 少 ? 第 四 组 呢 ? 

(b) 有 多 少 种 不 同 的 组 距 大 小 ? 

(c) 有 和 多少 个 开 组 距 ? 

(qd) 应 如 何 确定 最 后 一 组 才能 使 它 的 组 距 与 前 一 组 组 距 大 小 相等 ? 

(e) 第 二 组 组 中 值 是 多 少 ” 第 四 组 呢 ? 

(人 第 四 组 的 组 界 是 多 少 ? 

(g) 年 龄 大 于 等 于 35 岁 人 口 所 占 比 例 是 多 大 ? 年 龄 小 于 等 于 64 岁 呢 ? 

(hb) 年 龄 在 20 一 49 岁 之 间 人 口 所 占 比例 是 多 大 ? 


.735 1.727 1.734 1.732 1.736 1.741 
.731 1.746 1.735 1.735 1.729 1.734 


2.32 


2.33 


2.34 


(i) 年 龄 大 于 70 岁 人 口 所 占 比 例 是 多 大 ? 


表 2.15 
年 龄 组 百分率 
5 以 下 7.3 
5—9 7.3 
10—14 7.2 
15—19 7.0 
20—24 6.6 
23 一 29 7.2 
30—34 8.1 
35~39 8.5 
40 ~ 44 7.8 
45 ~ 49 6.9 
50 — 54 5.3 
55—59 4.3 
60—64 3.8 
65—74 7.0 
75—84 4.3 
85 K 85 以 上 1.4 


来 源 : 美 国人 口 调 查 局 最 新 人 口 报告 


(a) 为 什么 根据 表 2.15 中 分 布 不 能 建立 百分率 直方 图 或 百分率 频数 多 边 形 ? 

(b) 要 建立 百分率 直方 图 或 百分率 频数 多 边 形 需 对 现 有 分 布 作 怎样 的 修改 ? 

(c) 利 用 (b) 中 修改 完成 作 图 . 

在 表 2.15 中 ,假设 总 入口 为 265 000 000, 并 且 “ 小 于 5" 这 一 组 包括 不 到 1 岁 的 婴儿 .确定 每 组 人 数 (以 
百 万 计 , 并 保留 一 位 小 数 ). 

(a) 根 据 表 2.14 中 数据 建立 光滑 百分率 频数 多 边 形 和 光滑 百分率 卵 形 线 . 

(b) 利 用 (a) 中 结论 ,估计 每 周 看 电视 少 于 10 小 时 的 学 生 的 概率 . 

(c) 利 用 (a) 中 结论 ,估计 每 周 看 电视 等 于 或 多 于 15 小 时 的 学 生 的 概率 . 

(d) 利 用 (a) 中 结论 , 估计 每 周 看 电视 少 于 5 小 时 的 学 生 的 概率 . 

(а) ЧС тр 50 次 ,建立 每 次 抛掷 正面 数 表 . 

(b) 建 立 频数 分 布 来 显示 正面 次 数 是 0,1,2,3,4 的 抛掷 数 ， 

(c) 根 据 (b) 建 芯 相 应 的 百分率 分 布 . | 

(d) 把 (c) 中 得 到 的 百分率 与 理论 上 的 6.25% ,25% ,37.$% ,25%,6.25% (与 1,4,6,4,1 成 比例 ) 作 比 
较 . 

(e) 根 据 (a) 和 (b) 中 分 布 作 图 . 

(人 建立 数据 的 百分率 卵 形 线 . 

WRAKKEN EF 50 次 ,看 看 这 样 是 不 是 与 理论 值 更 一 致 ” 如 果 不 是 ,请 给 出 可 能 产生 差异 的 原因 . 





第 三 章 ”均值 , 中 位 数 , 众 数 以 及 其 他 
表示 集中 趋势 的 度量 


下 标 , 记 法 
符号 X 表示 变量 X 的 N NEX, X2, XX3,…, Ху 中 的 任意 一 个 .在 X, 中 ,可 代表 数字 1， 


2,3,…, № 中 任何 一 个 的 字母 六 称 为 下 标 .显然 ,其 他 的 一 些 字 母 , 比如 i,k, р, с 或 都 可 以 
作为 下 标 . 


求 和 符号 
符号 >) Хх, 表示 所 有 从 j=1 到 j=N 的 Xi 之 和 .由 定义 可 知 
Sx, = Xi + X+ Ху +з + XN 


在 不 产生 混淆 的 情况 下 , 我 们 常 简单 的 记 为 > X，》) XX,， > Xi .符号 >, 是 e 的 大 写 
希腊 字母 , 表示 求 和 . 


N 
例 1 D XY, = Xi Yı + Х,Ү, + Xy3Yy+ + 和 XNYN. 
1=1 


N М 
例 2 Š, aXj=aXı+aXı+aX; += +aXy=a(Xı+ X,+ X++ Ху) а УХ,, 
1 7=1 


其 中 a 是 一 个 常数 .简单 地 表示 为 : У]аХ =аЎ)Х. 
例 3 Жас ЕНИ, Д 2/(aoX+bY-cZ)=a>X+bY-cyZ .参见 
习题 3.3. 


平均 值 或 集中 趋势 的 度量 


平 沟 值 是 一 组 数据 典型 的 或 有 代表 性 的 值 .由 于 这 样 的 典型 值 趋向 于 落 在 根据 数值 大 小 
排列 的 数据 的 中 心 ,因此 平均 值 也 称 为 集中 趋势 的 度量 . 

可 以 定义 几 种 类 型 的 平均 值 , 最 常用 的 有 算术 平均 , 中 位 数 , 众 数 , 几何 平均 及 调和 平均 . 
根据 数据 情况 和 使 用 的 目的 ,每 一 类 平均 值 都 各 有 利 疼 . 


算术 平均 
N CIXI, XX2,X3,…, Xn 的 算术 平均 或 简称 均值 用 又 表示 , 定义 为 


= X++ X+ tX 2 ~ ХХ 
N = м N (1) 
例 4 8,3,5,12 M 10 的 算术 平均 值 为 


х 33:511050 38 = 7.6 
ШЖ Xi, Х,, ~, Xk УНЕ fi, Ро, 5, 反 次 ( 即 以 频数 Jo Р, fx HW), 那么 算术 平均 值 


为 





АХАХАХ _ 247% Уж ул 
fit fate + fx p Уу р Уу М 2) 


其 中 N = 3》\'f 是 总 频数 ( 即 数字 出 现 的 总 次 数 ). 
例 5 如 果 5,8,6 和 2 分 别 出 现 3,2,4 和 1 次 ,那么 它们 的 算术 平均 值 为 
_ 3Х5+2х8+4х6+1х2 _ 15+16+24+2 _ 
10 


加 权 算术 平 均 


有 时 ,根据 各 个 数字 的 显著 性 和 重要 性 , 我 们 需要 在 Xi, XX,,…, Xk 上 加 某 些 加 权 因 子 
(RE) wi, wase, wx .此 时 


—— wi Xi 十 иш. Х, 十 … 十 шкХұк У!) wX 
X = 一 一 一 一 全 = (3) 
о + 102 + 1 + wk >) 


称 为 加 权 算术 平均 .注意 , (2) 式 与 (3) 式 有 相似 性 , 因此 (2) 式 可 视 为 权 是 fi, fo, +, fk 的 加 
权 算 术 平 均 . 
例 6 设 一 门 功课 期 末 考 试 成 绩 的 权 是 小 测验 成 绩 权 的 3 倍 , 若 一 个 学 生 的 期 未 考试 成 
绩 为 85 分 ,小 测验 成 绩 为 70 和 90 分 , 则 平均 分 为 
X- 1х70+1х 90 +3 х 85 415 





1+1+3 5 = 83 


算术 平均 的 性 质 


1. 一 组 数 与 它们 的 算术 平均 之 差 的 代数 和 为 零 . 

例 7 8,3,5,12 和 10 与 它们 的 算术 平均 7.6 的 差分 别 为 8-7.6,3-7.6.5- 7.6, 12 - 
7.6 和 10-7.6, 即 0.4, -4.6, -2.6,4.4 和 2.4, 这 些 差 的 代数 和 为 0.4-4.6-2 6+4 4+ 
2.4=0. 

2. 一 组 数 X 与 任意 数 a 之 差 的 平方 和 当 且 仅 当 a = Х 时 达到 最 小 (见习 题 4.27). 

З.Ж 户 个 数 有 平均 值 mi, 户 个 数 有 平均 值 mw，,…, ук 个 数 有 平均 值 mw ,那么 这 些 数 
的 平均 值 为 





зс Јата етә +++ Јктк 
= fit fz+t t ГА (4) 
即 所 有 平均 值 的 加 权 平 均 ( 见 习题 3.12). 
4. 如 果 A 是 任 一 假定 算术 平均 值 (可 以 为 任何 数 )， 并 记 d, =X,- А, 那么 (1) 和 (2) 分 别 
变 为 
>а, У\а 
Х= А + N = А + ү (5) 
> fd; 
Хаз 1 д2 (6) 
2,7, 


ЖР № = Уу = D S ÈE, OMORE Бре Х= A +d( 见 习题 3.18). 
从 分 类 资料 中 计算 算术 平均 值 


当 数 据 以 频数 分 布 的 形式 表现 , 我 们 视 所 有 落 在 某 一 给 定 组 距 里 的 值 与 组 中 值 一 致 .如 果 
我 们 认为 X, 是 第 7 个 组 距 的 组 中 值 , f 是 相应 的 组 频数 , A 是 -- БЕЧ, Н d,=X, -A 
RRX 与 4 的 差 ,那么 (2) 和 (6) 式 可 用 于 分 类 资料 
使 用 (2) 和 (6) 式 的 计算 分 别称 为 长 和 短 方法 (见习 题 3.15 和 3.20). 
如 果 组 距 都 有 相等 的 宽度 c, 那么 а = Х;-А RH cu, 其 中 u TRE MERRE 


( 即 ,0, +1, +2, 二 3,…), 并 且 (6) 式 可 变 为 


К 





C (7) 











М 
此 式 与 等 式 X= A + cu 是 等 价 的 (见习 题 3.21) .这 种 方法 称 为 计算 平均 值 的 编码 法 .这 是 一 
种 短 方法 ,可 以 用 来 对 组 距 宽 度 相 等 时 的 分 类 资料 进行 计算 (见习 题 3.22 和 3.23). 在 编码 法 
中 ,变量 X 的 值 根据 X=A + си 变换 为 变量 的 值 . 

中 位 数 


一 组 数 根据 数量 大 小 排列 后 的 中 间 值 或 者 两 个 中 间 值 的 算术 平均 值 称 为 这 组 数 的 中 位 
Ж. 

例 8 一 组 数 3,4,4,$,6,8,8,8 和 10 的 中 位 数 是 6. 

例 9 一 组 数 5,5,7,9,11,12,15 和 18 的 中 位 数 是 方 (9+ 11) =10. 

对 于 分 类 资料 , 用 插值 法 求 中 位 数 的 公式 为 
N 

2 aal (8) 

fm 


中 位 数 = Li + 





其 中 
Li = 中 位 数组 ( 即 包含 中 位 数 的 组 ) 的 下 组 界 
N = 数据 的 总 个 数 
(Ур), = 中 位 数组 前 各 组 的 频数 和 
fa = 中 位 数组 频数 
с = 中 位 数组 组 距 宽度 | 

从 几何 上 看 ,中 位 数 是 分 直方 图 为 二 等 份 面积 的 垂直 线 的 X( 横 坐标 ) 的 值 . 这 个 X 的 值 常用 
XX 表示 . 
众 数 


一 组 数 的 众 数 是 出 现 次 数 最 多 的 那个 数 , 即 以 最 大 频数 出 现 的 数 . 众 数 不 一 定 存在 , 即使 
存在 也 不 必 惟 一 . 

例 10 一 组 数 2,2,5$,7,9,9,9,10,10,11,12 ¥ 18 的 众 数 为 9. 

例 11 一 组 数 3,5,8,10,12,15 和 16 无 众 数 . 

例 12 一 组 数 2,3,4,4,4,5,5,7,7,7 和 9 有 两 个 众 数 ,4 和 7, 称 为 双 峰 . 

只 有 一 个 众 数 的 分 布 称 为 单 峰 的 . 

当 分 类 资料 的 频数 曲线 用 来 拟 合 数据 时 , 众 数 是 曲线 上 最 大 值 点 的 Х 的 值 .这 个 X 的 值 
EXHAR 表示 . 

根据 频数 分 布 或 直方 图 计算 众 数 的 公式 为 


众 数 = 1, + METAL (9) 
其 中 ， 

Li= 众 数组 ( 即 包 含 众 数 的 组 ) 的 下 组 界 . 

Al = 众 数 频数 减 去 前 一 组 的 频数 . 

Az = 众 数 频 数 减 去 后 一 组 的 频数 . 

c= 众 数组 组 距 宽度 . 


均值 , 中 位 数 和 众 数 间 的 经 验 关 系 
对 于 微 斜 (不 对 称 ) 的 单 峰 频 数 曲线 , 我 们 有 经 验 关系 式 ， 
均值 - 众 数 = 3( 均 值 - 中 位 数 ) (10) 
图 3-1 和 图 3-2 分 别 表 示 了 向 右 、 向 左倾 斜 的 频数 曲线 的 均值 ,中 位 数 和 众 数 的 相对 位 
置 .对 于 对 称 曲线 ,均值 、 中 位 数 和 众 数 是 完全 一 致 的 . 


Дм LA 


шж R 
> к ха © 
在 在 
图 3-1 图 3-2 
几何 平均 С 
М NEX Xi, X2,…, Ху 的 几何 平均 С 等 于 这 些 数 乘积 的 N 次 方 根 : 
С = УХ, Х,Х Xy (11) 


例 13 数 2,4 和 8 的 几何 平均 值 为 G= /2х4хвВ= Уба 4. 
我 们 可 以 用 对 数 法 (见习 题 3.35) 或 计算 器 来 求解 С. 对 于 如 何 从 分 类 资料 中 求解 几何 平 
均 的 问题 ,参看 习题 3.36 A 3.91. 








调和 平均 H 
N NX], X25300, Ху WAME H 等 于 这 些 数 的 倒数 的 算术 平均 的 倒数 ， 
-本 = (12) 
улху, >x 
实际 应 用 中 , 简单 记 为 
1 
1 之 区 _ 1х1 
H° N = №2 у (13) 
(14 数 2,4 和 8 的 调和 平均 值 为 
3 3 _ 
=I 1 177538 
2 4 8 8 


对 于 如 何 从 分 类 资料 中 求解 调和 平均 的 问题 , 参看 习题 3 99 和 3.100. 
算术 平均 , 几何 平均 和 调和 平均 间 的 关系 
一 组 正 数 Xi, 多，,…, XN 的 几何 平均 小 于 等 于 它们 的 算术 平均 ， 但 大 于 等 于 它们 的 调和 
平均 .用 符号 表示 为 
Н<С<х (14) 
当 所 有 的 数 Х|, Xa ---, Ху 相等 时 , 等 号 成 立 
115 2,4,8 的 算术 平均 是 4.67, 几何 平均 是 4, 调和 平均 是 3.43. 


均 方 根 (RMS) 


一 组 数 Xi , Xa …, Ху 的 均 方 根 或 二 次 平均 常用 VX? 表示 , 并 定义 为 


ХХ; 2 
的 方 根 - /C= 这 一 - (220 


这 种 类 型 的 平均 常 在 实际 中 使 用 . 


例 16 1,3,4,5 和 7 的 均 方 根 为 


2 2 2 2 2 
0 = 4.47 


四 分 位 数 ,十 分 位 数 和 百 分 位 数 


(15) 


一 组 数据 按照 数量 大 小 排列 , 如 果 中 间 的 数 (或 两 个 中 间 数 的 算术 平均 ) 把 这 组 数 分 为 2 


个 相等 部 分 ,那么 这 样 的 数 称 为 中 位 数 .按照 这 种 思路 , 我 们 想到 了 那些 把 一 组 数 分 为 4 个 相 
等 部 分 的 数 . 这 些 数 用 Q, О, 和 О, 表示 , 分 别称 为 第 一 , 第 二 和 第 三 个 四 分 位 数 , 其 中 ©: 
等 于 中 位 数 . 


同样 地 , 把 一 组 数 分 为 10 个 相等 部 分 的 数 称 为 十 分 位 数 , 并 且 用 Di, Do, р, 表示 , 而 


把 一 组 数 分 为 100 个 相等 部 分 的 数 称 为 百 分 位 数 ,用 P1, P,, …, Pw 表 示 . 其 中 第 五 个 十 分 位 
数 和 第 50 个 百 分 位 数 与 相应 的 中 位 数 一 致 ,第 二 十 五 个 和 第 七 十 五 个 百 分 位 数 分 别 与 第 一 个 
和 第 三 个 四 分 位 数 相等 . 


类 资料 中 计算 这 些 值 , 参见 习题 3.44 到 3.46. 


习题 及 解答 
求 和 符号 
3.1 与 出 下 列 各 式 的 展开 式 : 
OXX, OD a: OD, =a). 


4 5 
(b) > (Y, - 3)?; (4) 20 АХА: 
ОШ (а)Х + Х,+Ху+Х,+Х,+Х, 
(Ъ)СҮ, 3) + (Ү, –3)2 + (Ү,-3)2+ (Үү, ~ 3)2 
(с)а +а+а+-- +а = Na 
(ФАХ, + РХ + ХХ, + fsXs 
(е)(Х; -а) + (Х,-а) + (Х-а)= Х,+Х,+Х,-3а 
用 求 和 符号 表达 下 列 各 式 ， 
(a) X1+ Х+ XI+ .+ XY; 
(b) (Xi1+ Yı)+(X,4 Үз) +- + (X+ Үз) 
(с) ХІН aX} ++ fao X2; 
(d) aib, + azb, + a3b3 + + anby; 
(e) ЛХ t f2X1Y2 + f3X3Y3 + f4X4Y4. 


+ 
7 


10 2 4 
解 EF (a) > X?; (e) >)у,Х?; (е) XI 5 ХҮ,. 


8 М 
(b) X (X, + Y,); (d) Š) a,b,; 


四 分 位 数 ,十 分 位 数 , 百 分 位 数 及 其 他 一 些 通过 等 分 数据 而 得 到 的 数 统称 为 分 位 数 . 从 分 


М 
3.3 证 明 > - ‚Сах, + = с2,) = а У) + | Y,- c), Z RP a,b Wc 是 
任意 常数 ， 
证 明 @ 
Уу бах, + bY, -‹7,) 

= (aX, + bY: 一 cZ) + (aX: + РҮ, 一 CZ > ) +... + (аХ у + DYN — CZN ) 

=(aXı + aX + + аХу) + (bY; + БҮ, 十 …+BYN)-(cZi+cZ + + сўм) 

=а(Х,+ Xa+ + Ху) + 5(Ү + Yat + Yy)-c(Zi+ Zi+ + Zy) 


=a), | х, +)" Үс 12, 
或 简略 记 为 
2i(aX+br-cZ)=a>IX+6>Y-cy>1Z. 
3.4 两 个 变量 X 和 Y, 假设 X =2, X= -5, Х;=4, Xs= -8, Yı = -3,Y,= -8,Y;=10, 
Y4=6. 计 算 (a)2)X,(b)2)Y,(c) У ХҮ, (4) 2) O Ү?,((>)х)(}У) Y), 
(в) >) ХҮ?, (h) У(Х + Ү)(Х – Y). 
解 E 注意 每 式 中 , X 和 Y 的 下 标 j 都 被 省 咯 了 ，》) 应 理解 为 >)”_,. 例如 , > х 简写 为 
DX. 
(а) УХ =2+(-5)+4+(-8)=2-5+4-8=-7 
(b) УУ = (- 3) + (- 8) + 10+6=-3-8+ 10 +6 = 5 
(с) OXY = 2х (- 3) + (- 5) х (8) +4х 10+ (8) х6 
= - 6 + 40 + 40 — 48 = 26 
(d) X} X? = 2? + (- 5)2 + 42 + (– 8)? = 4+ 25 + 16 + 64 = 109 
(е) Š, Y? = (- 3)2 + (– 8)2 + 102 + 62 = 9+ 64 + 100+ 36 = 209 
(Р) 根据 (a) ЖЬ), ( 2) X)(2)Y) = (- 7) х5 =- 35. 注 意 , (У) Хх) У) ү) = У\ хү 
(в) У) ХҮ? = 2(- 3)? + (— 5)(— 8)? + 4x 102 + (— 8) х 62 = – 190 
(OX+ YNX-Y) = Ў) (х2 – ү) = У\ х2 YY? = 109—209 =- 100 
3.5 如 果 了 ) X, =-4, 了) Х2 = 10, 计 算 :(a) У)‘ 0х, + 3), 
(b) > х, (X, — 1), (е) > (总 - 5), 


6 6 6 6 
Ж E (а) >; (0х, +3) = D2X) + >)3=2У)Х,+6х3 = 2(—4) +18 = 10 
1=1 J=1 =1 


УХ ХХ 0) = 02 - Х,) = DX- SX = 10- (-4) =14 
1=1 1=1 1 
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6 6 6 6 
(с) >],(Х,- 5)? = 21005 - 10X, + 25) = 305 ~ юх, + 25 х6 


= 10- 10(- 4) + 25 х6 = 200 


如 果 需 要 , ВИТЕ АНЕ АИ Т j 用 У) Ке Уу. 


1=1 


算术 平均 
3.6 一 个 学 生 6 门 功课 的 成 绩 分 别 为 84,91,72, 68,87 和 78, 求 6 门 成 绩 的 算术 平均 . 


— X 
8 w x- 20Х = 8091172168 +8778 40 _ go 


6 
有 时 ， 平均 与 算术 平均 是 同 义 的 但 是 严格 地 说 ,这 并 不 正确 ,因为 除了 算术 平均 外 ,还 有 其 他 定义 的 平 
均 数 . 


3.7 一 个 科学 家 记录 了 一 个 圆柱 体 直径 的 10 个 测量 值 .3. 88, 4.09,3.92,3.97,4.02,3.95， 
4.03,3.92,3.98 和 4.06 厘米 (cm). 求 这 些 测量 值 的 算术 平均 . 





— DX 
解 F X= N 
_ 3.88 + 4.09+3.92+3.97+4.02+3.95+4.03+3.92+3.98+4.06 
10 
39.82 


= = = 3,98 cm 


1 
3.8 如 下 Minitab 产生 的 数据 显示 了 30 个 Internet 用 户 每 星期 在 线 所 花 的 时 间 以 及 30 个 时 
间 的 平均 值 . 你 能 判断 这 个 平均 值 具有 代表 性 吗 ?” Minitab 软件 操作 如 下 ; 
MTB > print с] 
Data Display 


time 
3 4 4 5 5 5 5 6 
6 6 6 7 7 7 7 8 8 
9 10 10 10 10 10 10 12 55 60 
MTB > mean cl 


Column Mean 


Mean of time = 10.400 
И кё 平均 值 10.4 小 时 不 具 代 表 性 .在 这 30 个 时 间 数 字 里 有 21 个 是 一 位 数字 ,但 平均 值 为 10.4 


小 时 .这 个 平均 值 最 大 的 缺点 在 于 它 会 在 很 大 程度 上 受到 极 值 的 影响 . 
3.9 求 数 字 5,3,6,5,4, 5,2,8,6, 5,4,8,3,4, 5,4,8,2,5 和 4 的 算术 平均 . 


解 = 解法 一 


-+3+6+35+4+35+2+8+6+5+4+8+3+4+5+4+8+2+5+4 
= 一 一 一 一 一-~>4+o+o5+4+5+4+8+2+5+14 
20 


оо 


-20 = 4. 
解法 二 这 里 有 6 个 5,2 个 3,2 个 6,5 个 4,2 个 2 和 3 个 8, 因此 


5 
DO УХ Gx512x312X615X412X213X8 
У\; N 7 6+2+2+5 +2 + 3 








3.10 100 “н, Ж 20 1 4,40 1 5,30 1 6, 其 他 为 7, 求 这 些 数 的 算术 平均 . 


= DX SA 20х4+40х5+30х6+10х7 530 
ж EF Уу тр A = 880 = 5.30 
3.11 一 个 学 生 数学 物理 英语 和 卫生 学 的 期 末 成 绩 分 别 为 82, 86, 90 和 70. 如 果 这 些 课 程 
各 目的 学 分 分 别 为 3, $5,3 和 1, 求 一 个 恰当 的 平均 分 . 
Ж & 和 用 加 权 算 术 平均 , 权 取 为 学 分 数 . 


Y- 3x82+5x86+3x90+1x70 _, 
yu 3+5+3+1 = 85 


3.12 一 公司 有 80 个 员工 , 其 中 60 个 人 每 小 时 挣 10 美元 ,20 个 人 每 小 时 挣 13 美元 . 
(а) 求 每 小 时 平均 所 得 . 
(b) WR 60 个 员工 的 平均 小 时 工资 为 10.00 美元 ， 答案 会 与 (a) 一 样 吗 ? 
(с) 你 认为 平均 小 时 工资 具 代 表 性 吗 ? 


# ES (a) X = 全 :一 = +оо = 10.75 美元 
(b) 结果 会 一 样 .下 面 给 出 证 明 . 假 设 у, 个 数 的 平均 值 为 m1, у» 个 数 的 平均 值 为 m,. 我 们 要 证 明 所 
有 数 的 平均 值 为 


y=- fimı +t fm 


Л» 
或 Mi= fimi, M2= f2m2. 由 于 (fi1+ 户 ) 个 数 的 和 为 (M; + M,), 这 些 数 的 算术 平均 为 
т. M tM: _ Лті+ fam 
fith fit f 
这 正 是 我 们 要 证 明 的 .结果 很 容易 推广 . 
(с) 由 于 大 多 数 员工 小 时 工资 为 10.00 美元 , 这 与 10.75 美元 相差 不 多 , 因此 我 们 认为 10.75 美元 是 
有 代表 性 "的 小 时 工资 .必须 记 住 , 当 我 们 把 数值 数据 相 加 为 一 个 数 时 (如 在 计算 平均 值 时 那样 ) 我 
们 可 能 会 造成 一 些 误差 .然而 , 结果 不 会 像 习 题 3.8 那样 产生 误解 . 
实际 中 , 为 了 安全 起 见 ,应 该 给 出 关于 数据 平均 值 的 “差距 "或 “ 变 差 ”. 这 称 为 数据 的 离 差 . 离 差 的 
不 同 度量 将 在 第 四 章 介绍 . 
四 组 学 生 分 别 由 15,20,10 和 18 人 组 成 , 每 一 组 的 平均 体重 分 别 为 162, 148, 153 和 
140 磅 . 求 所 有 学 生 的 平均 体重 . 


解 em y- R15X162+20x1481+10x153+18x 140 
fo 15 + 20 + 10+18 


如 果农 业 和 非 农 业 收 入 者 的 平均 年 薪 分 别 为 25 000 美元 和 35 000 美元 ,那么 两 组 人 合 
起 来 的 平均 年 薪 是 否 为 30 000 美元 ? 


解 E 只 有 当 农 业 和 非 农 业 收 入 者 人 数 相等 时 , 两 组 人 合 起 来 的 平均 年 薪 是 30 000 美元 .要 知道 
真正 的 平均 年 薪 , 就 必须 知道 每 一 组 的 相对 人 数 .假设 有 10% 的 人 是 农业 收入 者 .此 时 ,平均 值 应 为 
0.10х 25 000+0.90x35 000 = 34 000 美元 .如 果 两 组 人 数 相等 , 平均 值 应 为 0.50x25 000+0 50x 
35 000 = 30 000 美元 . 
用 表 2.1 身高 的 频数 分 布 来 求 XYZ 大 学 100 个 男 同 学 的 平均 身高 
М E 数据 已 经 归纳 在 表 3.1 中 .注意 ,这 里 身高 60 一 62 英寸 ,63 一 65 英寸 等 等 都 被 认为 身高 是 
61 英寸 , 64 英寸 等 等 .问题 转化 为 求 100 个 学 生 的 身高 , 其 中 5 个 学 生 身高 61 英寸 , 18 个 学 生 身 高 
64 英寸 等 等 . 

特别 是 在 数据 很 多 并 且 组 数 很 多 的 情况 下 ,计算 会 很 复杂 .恰当 的 短 技术 会 减少 计算 量 , 见习 是 
3.20 和 3.22. 


hth 
假设 f 个 数 的 和 为 Mi, f 个 数 的 和 为 M .根据 算术 平均 的 定义 ， 
_ М, _ M 
ттр’ "= 


= 150 }Ё 


_ 6745 _ 
= 100 = 67.45 英寸 


M 
> 
k 


算术 平均 的 性 质 


3.16 


证 明 Xi, X,,…, Ху 与 它们 的 平均 值 X 的 差 的 和 等 于 零 . 
证 明 F а = Xi-X,d,= Х›—- X,.…,dy= Ху-Х. 
差 的 和 = уза, = D(X,-X)= У\Х, -NX 
-Dx -n| 25 = DX- УХ, =0 
其 中 ，>) ону 代替 .如 需要 ,可 在 不 产生 误解 的 情况 下 ,省略 X БИГЕ). 
ШЖ Z1= Xit Yi, Z2= X+ Y2, Z= Xn + Yn, WE Z=X+Y. 
证 明 ”QP 根据 定义 ， 


1 





| 


— УХ _— DY _ 2 
Хем YN 2= 7 


因此 


= = = =X+Y 


=- ÈZ DOX+I YXryy Ух yy 
NN 和 + 人- 
КФ, Бу iD 代替 ,X,Y 和 2 的 下 标 j ЖТ. 
Са) Ж N 个 数 XX1, Xa,…, Ху 与 任意 数 A 的 差 为 41 = ХА, d= ХА, d= 
Xn- A, WPR: 


(Ъ)Х,, X>, aa Хк 的 频数 分 别 为 Fi, fo, с, Ёк, 并 且 dı =X; ~ А, da= X; — А, б, dk 
= Xk — 4, 证明; 此 时 (a) 中 的 结论 变 为 





>, fad, У\ fd 
X= A+ 5k = А + N 
24% 
其 中 
K 
> = X f=N 
证 明 F (а) 证 法 一 由 于 а;= Х,- А,Х,= А +4q,, 我 们 得 到 
zX EDA) УА+ Уа м: Уа va 
“N = N = N TOO N А+ 


Et, Бу ну КЖ. 
EE ”省略 d 和 XX 的 下 标 , 我 们 有 4 =X-A, X Х=А+@. 因此 根据 习题 3.17, 上 且 由 于 一 组 常数 
A 的 平均 数 仍 然 是 A, 我 们 得 到 


(b) 


N N 


А5 + Ула, AN+Dfa Vpa У) ja 
= N у тА +0 4+ Ny 


注意 在 形式 上 结果 可 以 从 (a) 得 到 ,只 要 把 d, 换 成 jii, 求 和 从 j=1 到 天 换 成 =1 到 N. 此 结果 等 价 
于 X=A+d, 其 中 d= (> )/4)/М. 

从 分 类 资料 中 计算 算术 平均 

3.19 用 习题 3.18(a) 的 方法 求 5, 8, 11, 9, 12,6,14 和 10 的 算术 平均 , 其 中 A 取 .(a)9;(b) 
20. 
E F (a) 给 定数 字 与 9 的 差分 别 为 -4,-12,0,3,-3,5 和 1, 这 些 差 的 和 为 


>,d=-4-1+2+0+3-3+5+1=3. 因 此 








Х-А+©44-9+ 3_ 937 
-7 N ` 877 
(b) 给 定数 字 与 20 的 差分 别 为 -15, – 12, -9 -11, -8, -14, -6 #91-10, У\а =- 85. 因此 
— >d -85 
Х = А + = = 20+ 7 = 9.375 


3.20 用 习题 3.18(b) 的 方法 求 XYZ 大 学 100 个 男 同 学 的 平均 身高 (见习 题 3.15). 
М F 数据 已 经 整理 在 表 3.2 中 .尽管 任何 组 中 值 都 可 作为 А, {ПД A 为 组 中 值 67( 它 的 频数 


最 大 ) .这 里 的 计算 比 习题 3.15 中 的 简单 一 些 .要 使 得 计算 更 简便 , 我 们 就 要 采用 习题 3.22 中 的 方 
法 ,那里 的 差 ( 表 3.2 的 第 二 列 ) 都 是 组 距 大 小 的 整 倍数 


组 中 值 (X) 





>) fa 45 
N = 67 + 100 = 67-45 英寸 


3.21 d,=X, -A 表示 在 一 频数 分 布 中 任 一 组 中 值 X, 与 一 给 定 组 中 值 A 的 差 . 证 明 如 果 所 
有 的 组 距 有 相同 的 大 小 с, 那么 (a) 这 些 差 都 是 。 的 倍数 ( 即 ， 4; = cu, ù, =0, +1, +2, 
…);(b) 平 均值 的 计算 公式 可 写 为 


Х=А+ 





X=A+ 


С 





> fu 
N 





证 明 EF (а) 习题 3.20 的 表 3.2 已 经 说 明了 结论 ,其 中 第 二 列 中 的 数 都 是 组 距 大 小 с = 3 英寸 的 
整数 倍 . 
为 了 证 明 在 一 般 情况 下 结论 也 成 立 , 设 Xi, Х,, Xi, … 是 连续 组 中 值 ， 它们 共同 的 差 为 c, 因此， 
2=Xit+cXs=X2+c, 一 般 地 ,X=Xi+( 人 -1l)c. 任 意 两 个 组 中 值 X, AX, 的 差 为 
Х„-Х„=[([Хү+(р-1)с]-[Х,+(е@-1)с] = (p - q)c 
显然 这 是 с 的 倍数 . 
(b) 根据 (a), 所 有 组 中 值 与 任 一 给 定 组 中 值 的 差 是 。 的 倍数 ( 即 , d, = cu). 利 用 习题 3.18(b), 得 到 


1 Ccu) J“ 
x = a + 2004 ыг ас 








= А + 


= А + әм 
М 


C 


ЕШ КТ ТТ X=A+cu, REEX=-A+d PH cu Ка, В cz 代替 了 (见习 题 3.18)， 
3.22 用 习题 3.21(b) 的 结论 求 XYZ 大 学 100 个 男 同学 的 平均 身高 (见习 题 3.20). 


解 F 数据 已 经 整理 在 表 3.3 中 .这 种 方法 称 为 编码 法 ,可 尽 可 能 地 使 用 . 





15 _ з 
с = 67+ 100 X 3 = 67.45 英寸 


3.23 根据 表 2.5 的 频数 分 布 用 (a) 长 方法 ;(b) 编 码 法 计算 P&R 公司 65 个 员工 的 平均 周 薪 . 
解 ES 表 3.4 和 3.5 分 别 给 出 了 (a) 和 (b) 的 解 . 


Х= А + 





У) Ји 
М 





表 3.4 表 3.5 











2040.00 









265.00 2650.00 

275.00 4400.00 А-=275.00 

285.00 3990.00 285.00 14 
295.00 2950.00 295.00 20 
305.00 1525.00 305.00 15 






630.00 
> fX = 18, 185.00 


315.00 






由 于 实际 上 组 中 值 是 254.995 美元 , 264.995 美元 等 , Е 255.00 美元 , 265.00 美元 等 , 因此 在 
这 些 表 中 有 必要 引进 误差 ,如果 在 表 3.4 中 用 真实 的 组 中 值 进 行 计算 ,那么 X 不 是 279.77 美元 , 而 是 
279.76 美元 ,两 者 的 差 可 忽略 . 


> fX _ 18 185.00 


Х = NN 65 


= 279.77 美元 


Х= А + 31 


225 |. = 275.00 + = x 10 = 279.77 美元 
М 65 


3.24 根据 表 2.9(d), 计 算 P&R 公司 70 个 员工 的 平均 周 薪 ， 
解 кею 这 里 ,组 距 大 小 不 相同 ,我 们 必须 用 长 方法 ,如 表 3.6 БЕ. 





表 3.6 





255.00 2040.00 








265.00 2650.00 
275.00 4400.00 
285.00 4275 00 
295.00 2950 00 
310.00 8 2480.00 
350.00 3 1050.00 
N=70 УУХ = 19 845.00 





一 一 一 O 


中 位 数 


3.25 


ў - 241Х _19 343.00 = 283.50 美元 





如 下 Minitab 产生 的 数据 显示 了 30 个 Internet 用 户 每 周 在 线 所 花 的 时 间 以 及 30 个 时 
间 的 中 位 数 .验证 这 个 中 位 数 .这 个 中 位 数 具 有 代表 性 吗 ? 把 你 的 结论 与 习题 3.8 的 结 
论 作 个 比较 .Minitab 软件 操作 如 下 : 

MTB>Pprint сі 

Data Dispiay 


time 
3 4 4 5 5 5 5 6 
6 6 6 7 7 7 8 8 


9 10 10 10 10 10 10 12 55 60 


MTB > median cl 
Column Median 
Median of time = 7.0000 


М S 这 里 两 个 中 间 值 都 为 7, 并 且 两 个 中 间 值 的 平均 是 7. 习 题 3.8 中 ,平均 值 为 10.4 小 时 .这 
里 的 中 位 数 比 平均 值 更 具 代 表 性 ， 
在 一 个 大 城市 里 ,有 15 个 地 方 记录 АТМ 每 天 的 交易 量 .这 些 数据 为 :35, 49, 225, 50, 
30, 65, 40, 55, 52, 76, 48, 325, 47,32 和 60. 求 (a) 交 易 量 的 中 位 数 , (b) 交 易 量 的 平均 值 . 
解 S (a) 按 顺序 这 些 数 排列 为 :30,32,35, 40, 47, 48, 49, 50, 52, 55,60, 65, 76, 225 和 325. 由 于 这 
里 有 奇数 个 数 ,因此 只 有 一 个 中 间 值 50, 即 为 所 求 的 中 位 数 . 
(Ь)15 个 值 的 和 为 1189. 平 均值 为 1189/15 = 79.267. 

注意 ,中 位 数 不 受 两 个 极 值 225 和 325 的 影响 , 而 平均 值 会 受到 它们 的 影响 . 在 这 个 例子 中 , 中 位 
数 较 好 地 描述 了 АТМ 每 天 交易 量 的 平均 值 . 
如 果 有 (a)85;(b)150 个 数 排列 在 一 个 数组 里 , 如何 找 出 它们 的 中 位 数 ? 
Я EF (a) 由 于 85 个 数 是 奇数 个 数 ,只 有 一 个 中 间 值 , 在 它 前 面 有 42 个 数 ,在 它 后 面 有 42 个 数 . 
因此 中 位 数 是 数组 中 第 43 个 数 . 
(b) 由 于 150 个 数 是 偶数 个 数 , 有 两 个 中 间 值 ,在 它们 前 面 有 74 个 数 ,在 它们 后 面 有 74 个 数 .这 两 个 
中 间 值 是 数组 里 第 75 和 第 76 个 数 ,它们 的 算术 平均 就 是 所 求 的 中 位 数 . 
根据 习题 2.8(a) 表 2.7 的 频数 分 布 ( 重 新 设计 为 表 3.7);(b) 原 始 数据 分 别 求 州 立 大 学 
40 个 男 同 学 体重 的 中 位 数 . 


解 S (a) 解 法 一 (插值 法 ) 假设 表 3.7 的 体重 频数 分 布 是 连续 的 .在 此 例 中 , 中 位 数 是 有 总 频数 
(40/2= 20) 一 半 的 体重 低 于 它 , 一 半 的 体重 高 于 它 的 体重 值 . 


前 三 组 频数 的 和 为 3+5+9=17. 为 了 得 到 20, 我们 至 少 在 第 四 组 的 12 个 值 中 取 3 个 ， 由 于 第 四 
组 145—153 对 应 体重 为 144.5 到 153.5, 因此 中 位 数 为 


144.5 + х (153.5 — 144.5) = 144.5 + 5 х9 = 146.8 8 
Ж 3.7 解法 二 (公式 法 ) 由 于 前 三 组 和 前 四 组 的 频数 和 


分 别 为 3+5+9=17 和 3+5+9+12=29, 显 然 中 









118— 126 3 位 数 在 第 四 组 , 因此 第 四 组 就 是 中 位 数组 . 
3 5 ;= 中 位 数组 的 下 组 界 = 144.5 
9 
145 一 153 12 М = 数据 的 数目 = 40 
154—162 5 ( > yf)1= 中 位 数组 前 各 组 的 频数 和 =3-5+9= 
163 一 171 4 17 
172 一 180 2 


f= 中 位 数组 组 频数 = 12 
c= 中 位 数组 组 距 宽度 =9 


3.29 





众 数 


3.31 


因此 ， 








N _ 
Ш = 11+ |2 ei c = 144.5 + 10/2- 17 о = 146.8 18 
fm 
(b) 原 始 数据 排列 成 数组 


119, 125, 126, 128, 132, 135, 135, 135, 136, 138, 138, 140, 140, 142, 142, 144, 144, 145, 145, 146, 146, 
147, 147, 148, 149, 150, 150, 152, 153, 154, 156, 157, 158, 161, 163, 164, 165, 168, 173, 176 

中 位 数 等 于 数组 中 第 20 和 第 21 个 体重 值 的 算术 平均 , 等 于 146 磅 . 

从 (a) 直 方 图 , (b) 百 分 率 卵 形 图 中 求 习题 3.28 体重 的 中 位 数 . 


解 F (a) 图 3-3(a) 是 习题 3.28 体重 对 应 的 直方 图 .直线 LM 把 直方 图 分 为 面积 相等 的 两 部 分 ， 


中 位 数 就 是 直线 LM 对 应 的 横 坐 标 . 由 于 在 直方 图 中 面积 与 频数 是 对 应 的 , 直线 LM 左边 和 右边 的 


频数 为 总 频数 的 一 半 , 即 20. 因此 AMLD 和 MBEL 的 面积 分 别 对 应 于 频数 3 和 9.4M=- 孔 AB = 5 


х9= 2.25, 中 位 数 的 值 为 144.5+2.25= 146.75 或 伟人 至 最 近 的 十 分 位 数 146. 8 磅 .这 个 值 也 可 近 


似 地 从 图 中 读 出 . 


累积 频率 ( %) 





117.5 126.5 135.5 144.5 153.5 162.5 171.5 180.5 


体重 〈 磅 ) 
(b) 


(b) 图 3-3(b) 是 习题 3.28 体重 对 应 的 累积 频率 多 边 形 (或 百分率 卵 形 线 )， 中 位 数 是 曲线 上 已 点 的 横 
坐标 , P 点 的 纵 坐 标 是 50 % .为 了 计算 结果 ,看 相似 三 角形 РОК 和 TSR 


RQ _ PQ „ RQ _ 50% -42.5% 1 


_ _1 ар. 
RS = ST 9 一 72.5% 二 42.5% 7 4 RQ = д =2.25 


因此 , 中 位 数 =144.5+RQ =144.5+2.25$= 146.75 Е 

或 舍 入 至 最 近 的 十 分 位 数 146.8 磅 .这 个 值 也 可 近似 地 从 图 中 读 出 . 

Ж PERAR 65 个 员工 工资 的 中 位 数 (见习 题 2.3). 

解 EF 这 里 N=65, N/2= 32.5. 由 于 前 两 组 和 前 三 组 的 频数 和 分 别 为 8+10=18 和 8+10+16= 
34, 中 位 数组 是 第 三 组 .应 用 公式 ， 





中 位 数 = [А + 





М 
= – ( ) ‚ — 
2 2.7 с = 269.995 + 32 2- 18 x 10.00 = 279.06 美元 


Ж(а)3,5,2,6,5,9,5, 2,8,6, (Ь)51.6, 48.7, 50.3, 49.5, 48.9 的 平均 数 , 中 位 数 和 众 
数 . 


B EF (a) 排 列 成 数组 ,2,2,3,5,5, 5,6,6,8 和 9. 


平均 值 = 了 (2+2+3+5+5+5+161618+9)=5.1 


中 位 数 = 两 个 中 间 数 的 算术 平均 = 广 (5+5)=5 
众 数 = 发 生 次 数 最 多 的 数 =5 
(b) 排 列 成 数组 ;48.7,48.9,49.5,50.3,51.6. 
平均 值 = E (48.7+48.9+49.5+50.3+51.6)=49.8 
中 位 数 = 中 间 数 =49.5 
众 数 = 发 生 次 数 最 多 的 数 (这 里 不 存在 ) 
3.32 与 出 根据 频数 分 布 中 的 数据 求 众 数 的 公式 . 
коо 解 кє 假设 图 3-4 表示 频数 分 布 直方 图 的 三 个 矩形 , 中 间 
| ВЕ 的 矩形 与 众 数组 对 应 ,并 且 组 距 有 相等 的 大 小 
A Е Fo А, 我 们 定义 众 数 是 QS 和 RT 连 线 交 点 PP HREN X. 
X= 上 i 入 = U 分 别 代表 众 数 组 的 下 组 界 和 上 组 界 ， 
Al 和 А, 分 别 代 表 众 数组 频数 与 左右 两 组 频数 的 差 . 
根据 相似 三 角形 РОК 和 PST, 我 们 有 
ЕР _ РЕ X-L, 


U,- X 
ROT ST 或 A ` 









那么 
Al - L,) =4A(U,- £), AX - AL; = Д0, – ДХ 
(AtA) = Д0, + АГА 


由 于 U = Li+c, 其 中 < 是 组 距 大 小 ,上 式 变 为 


у 一 A (Lı +c)+ ALi (A + A2) L; + Aic А, 
№; + А, А, + Д, А, + А 


这 个 结果 有 一 个 有 趣 的 解释 .如 果 一 条 抛物 线 经 过 图 3-4 三 个 矩形 上 端的 中 点 ,那么 这 条 抛物 线 顶 点 
的 模 坐 标 与 上 述 得 到 的 众 数 一 致 





3.33 用 习题 3.32 得 到 的 公式 求 PER 公司 65 个 员工 工资 的 众 数 (见习 题 3.23). 


解 EF 这 里 L = 269.995 美元 ,Al = 16—-10=6,Л›=16-14=2,с =10.00 美元 , 因此 ， 


ЖЖ = 11 "хех. 





2_ _oO _ 一 
с = 269,995 + э +&* 10.00 = 277.50 美元 


均值 , 中 位 数 和 众 数 之 间 的 经 验 关系 


3.34 (a) 用 经 验 公式 ;均值 - 众 数 =3( 均 值 - 中 位 数 ), 求 P&R 公司 65 个 员工 工资 的 众 数 . 
(b) 用 这 里 的 结果 与 习题 3.33 的 结果 作 比 较 . 


EO 097 (a) 根 据 习题 3.23 和 3.30 我 们 知道 均值 =279.77 美元 , 中 位 数 =279.06 美元 .因此 ， 
众 数 = 均值 -3( 均 值 - 中 位 数 ) = 279.77- 3(279.77 - 279.06) = 277.64 美元 

(b) 习 题 3.33 中 的 工资 众 数 是 277. 50 美元 ， 与 经 验 结果 有 较 好 的 一 致 性 . 
几何 平均 


3.35 求 3,5,6,6,7,10 和 12 的 (a) 几 何平 均 ;(b) 算 术 平 均 . 


解 F(a) 几何 平均 = G= /3х5хбхбх7х10%1Э = V453 600. 用 常用 对 数 , JogG = 
了 log453 600 = + x 5.6567 = 0.8081, G =6.43( 舍 入 至 最 近 的 百 分 位 ). 也 可 用 计算 器 计算 . 
PR logG = 2- (03 + 1085 + 1086 + log6 + log7 + 10610 + 10812) 

_ 1 
”7 


(0.4771 + 0.6990 + 0.7782 + 0.7782 + 0.8451 + 1.0000 + 1.0792) 


3.36 


3.37 


3.38 


= 0.8081 
G = 6.43 

(b) 算 术 平均 = 往 = 本 (3+5+6+6+7+10+12)=7. 这 说 明 了 一 组 不 等 正 数 的 几何 平均 值 小 于 算术 
平均 值 
数 X1, XX，，…, Xk 发 生 的 频数 分 别 为 1, Р, fx, 其 中 f1+ f2+… + рк М 为 总 频 
Ж. 
(а) 求 几 何平 均 G; 
(b) 写 出 logG 的 表达 式 ; 
(с) 如 何 用 得 到 的 结果 求 频数 分 布 中 分 类 资料 的 几何 平均 ? 


у 
# F (a)G= VXIXI ХХХ ХХК ХЕ = УХХ Хк 
让 次 К f 


其 中 , N = 》) 了 .这 常 称 为 加 权 几 何平 均 . 
(b) logG = Nlog( Xi ХХ) = (filogX + fologX; + … + frxlogXx) 


= L5 вх, = feeX 
这 里 我 们 假设 所 有 的 数 都 是 正 的 ; 否则 对 数 没有 定义 ， 
注意 , 一 组 正 数 的 几何 平均 的 对 数 等 于 这 组 数 对 数 的 算术 平均 . 
(c) 如 果 假 设 Xi, X,,…, Хк 是 组 中 值 , f1, 户 .…, ук 是 相应 的 频数 ,那么 上 述 结果 可 用 来 求 分 类 数据 
的 几何 平均 值 . 
一 年 中 每 夸 特 牛奶 对 每 条 面包 的 价格 比率 为 3.00, 而 在 下 一 年 中 这 个 比率 为 2.00. 
(а) 求 两 年 间 和 牛奶 对 面包 价格 比率 的 算术 平均 ; 
(b) 求 两 年 间 面 包 对 牛奶 价格 比率 的 算术 平均 ; 
(с) 讨论 用 算术 平均 来 计算 平均 比率 的 可 行 性 ; 
(d) 讨论 用 几何 平均 来 计算 平均 比率 的 合理 性 . 
E E (а) 牛奶 对 面包 价格 比率 的 算术 平均 = 方 x (3.00 + 2.00) =2.50. 
(b) 由 于 第 一 年 牛奶 对 面包 价格 比率 是 3.00, 因 此 面包 对 牛奶 价格 比率 是 1/3.00=0.333. 同 理 ,第 二 


年 面包 对 牛奶 价格 比率 是 1/2. 00 = 0.500, 所 以 , 面包 对 牛奶 价格 比率 的 算术 平均 = 3-00.333 + 
0.500) = 0.417. 

(c) 如 果 算 术 平 均 是 恰当 的 平均 数 ,那么 牛奶 对 面包 价格 比率 的 算术 平均 是 面包 对 牛奶 价格 比率 的 算 
术 平 均 的 倒数 .然而 ,1/0.417=2.40 取 2.50. 因 此 ,这 里 用 算术 平均 来 计算 平均 比率 是 不 可 行 的 . 

(d) 牛 奶 对 面包 价格 比率 的 几何 平均 = V3.00x2.00= /500. 

面包 对 牛奶 价格 比率 的 几何 平均 = V0.333X0.500= V0.0167 =1/ V6.00. 

由 于 这 两 个 平均 值 互 为 倒数 , 因此 对 这 一 类 型 的 问题 我 们 认为 更 适合 用 几何 平均 来 计算 平均 比率 . 
在 某 种 环境 下 一 种 细菌 数量 在 三 天 内 由 1000 增加 到 4000. 求 每 天 的 平均 增长 率 


解 EF 由 于 从 1000 增加 到 4000 增长 了 300% ,有 人 可 能 认为 每 天 的 平均 增长 率 是 300%/3= 
100% .然而 ,这 意味 着 在 第 -天 细菌 数 从 1000 增加 到 2000, 第 二 天 细菌 数 从 2000 增加 到 4000, 第 三 
天 细菌 数 从 4000 增加 到 8000, 显然 与 事实 不 符 . 

为 了 求 出 正确 的 结论 ,我 们 把 这 个 增长 率 记 为 ;. 
一 天 后 细菌 数 = 1000 + 1000r =1000(1+ r) 
两 天 后 细菌 数 =1000(1+r)+1000(1+r)r=100001+7)2 
三 天 后 细菌 数 = 1000(1 + r)2+1000(1+ >)2r = 1000(1 +r)? 
最 后 一 个 表达 式 应 等 于 4000. 因 此 1000(1+ r)? = 4000, (1+ x)3=4,1+ r=J4,r=J4-1=1.587-1 

=0.587, r = 58.7%. 

一 般 地 , 如 果 开 始 量 是 已 ,单位 时 间 增 长 率 是 一 常数 ， 在， 个 单位 时 间 后 ,数量 变 为 
А = Р(1+ ғ)" 


这 称 为 复 利 公式 (见习 题 3.94 和 3.95). 


调和 平均 
3.39 求 3,5,6,6,7,10 和 12 的 调和 平均 H. 
1 1 二 = 才 | 十 + 二 + 二 + 工 + 工 + 工 + 工 
# S =N 2 t 3 75766 71012 
- 1 [140+ 84+70+70+60+42 +35]. 501 
227 420 294 
_ 2940 _ 
Н= 4292 =5.87 


通常 把 分 数 先 表示 为 小 数 形 式 会 简便 一 些 , 如 


+ = (0.3333 + 0.2000 + 0.1667 + 0.1667 + 0.1429 + 0.1000 + 0.0833) 





7 
此 时 , Н = 1-00 = 5.87. 


与 习题 3.35 作 比 较 后 发 现 , 一 些 不 全 等 的 正 数 的 调和 平均 小 于 它们 的 几何 平均 , 因此 也 就 小 于 
算术 平均 . | 
3.40 在 连续 的 4 年 里 , 一 个 家 庭 主妇 分 别 以 每 加 仑 (gal)0.80 美元 ,0.90 美元 , 1.05 美元 和 
1.25 美元 的 价格 购买 火炉 燃油 . 求 4 年 间 油 的 平均 价格 . 
解 F 情况 一 ”假设 这 个 家 庭 主妇 每 年 购买 相同 数量 的 燃油 , 比如 1000 加 仑 .那么 


. _ 总 价 _ 800 + 900 + 1050 + 1250 
平均 价格 = КЕ = 


1600 = 1.00 美元 / MWE 


这 与 每 加 仑 的 价格 的 算术 平均 是 一 样 的 , 即 
+ (0.80 +0.90 + 1.05 +1.25) = 1.00 美元 / me 


如 果 每 年 购买 x 加 仑 燃油 , 这 个 结果 依然 成 立 . 
情况 二 ”假设 这 个 家 庭 主妇 每 年 支出 相等 的 钱 购买 燃油 , 比如 1000 美元 , 那么 


af 4000 _ _ 
下 均 价 格 = АШ 1250 +1111 + 952 + 800 一 0.975 美元 / MÈ 


这 与 每 加 仑 的 价格 的 调和 平均 是 一 样 的 , Вр 


4 
1 1 1 1 


0.807 0.90 * 1.05 + 1.25 

如 果 每 年 y 美元 购买 燃油 , 这 个 结果 依然 成 立 . 

尽管 两 种 平均 值 是 在 不 同情 况 下 计算 得 到 的 ,但 它们 的 平均 过 程 都 是 正确 的 . 

注意 , 如果 每 一 年 购买 的 燃油 数量 不 等 , 那么 情况 一 中 的 普通 算术 平均 就 应 用 加 权 算 术 平均 来 代 
普 . 同 理 ,如 果 每 一 年 支付 不 等 的 钱 购买 稀 油 ,那么 情况 二 中 的 普通 调和 平均 就 应 用 加 权 调和 平均 

3.41 一 辆 车 以 时 速 25 英里 行驶 25 英里 , 以 时 速 50 英里 行驶 25 英里 , 以 时 速 75 英里 行驶 

25 交 里 . 求 三 个 速度 的 算术 平均 和 调和 平均 . 哪 一 个 正确 呢 ? 
解 BE 平均 速度 等 于 总 路 程 除 以 总 时 间 ， 





= 0.975 


全 -~ 40.9 英 里 / 小 时 
1+ + 2 
2 3 
3 个 速度 的 算术 平均 值 为 
25 + 50 + 75 _ 50 英里 / 小 时 
调和 平均 如 下 求解 ， 


d 1 ДА _ 101 1 1) 11 450 а 
HINS у= ЗЕ: 50 7 75/ 7 450 Н = тр = 40.9 英 里 /小 时 
调和 平均 是 平均 速度 正确 的 度量 . 


3.42 求 3,5,6,6,7,10 和 12 的 均 方 根 . 
解 @ 均 方 根 = 6710007 37=7.55 
3.43 证 明 两 个 不 等 正 数 a,b 的 均 方 根 大 于 它们 的 几何 平均 . 
证 明 ez 我 们 要 证 明 / 方 (a?+6?) > Vb. 假如 此 不 等 式 成 立 ,两边 同 时 平方 得 ; 
Z Ca? + 62) >ab, 0, a? +b? >2ab, a?- 2ab + b?>0, (а -5)?>0. 由 于 任何 不 为 零 的 实数 的 平方 
是 正 的 , 因此 最 后 的 不 等 式 是 正确 的 . 
上 述 步 骤 倒 推 可 得 到 本 题 的 证 明 . 因 为 (a — 6)?>0, 所 以 а2 + bp?>2ab, 方 (a?+6?)>ab, 最 后 
aga [1 
得 到 > (а2+ 2) > Sab. 
注意 ， | Tla? b?) = Vab 当 和 且 仅 当 a =b. 
四 分 位 数 ,十 分 位 数 和 百 分 位 数 
3.44 求 P&R 公司 65 个 员工 工资 的 (a) 四 分 位 数 Qi Q2, Q@3;(b) 十 分 位 数 Di, D,,…, Do 


(见习 题 2.3). 
# БР (a)Qi 是 从 第 一 组 数 起 第 N/4=65/4=16.25 个 工资 数 . 由 于 第 一 组 有 8 个 数据 ,必须 从 


第 二 组 中 取 8.25= 16.25 -8 个 数据 .用 线性 插值 法 ， 得 到 Qi; = 259.995 + Ет х 10.00 = 268.25 美元 


Q: 是 从 第 一 组 数 起 第 2N/4= №/2 = 65/2 = 32.5 个 工资 数 . 由 于 前 两 组 有 18 个 数据 , 必须 从 第 
三 组 中 取 32.$S-18=14.5 个 数据 ,因此 


Q, = 269.995 + 14.3 x 10.00 = 279.06 美元 


Оз 是 从 第 一 组 数 起 第 3N/4 = Z х65=48.75 个 工资 数 .由 于 前 四 组 有 48 个 数据 ,必须 从 第 三 
组 中 取 48.75- 48=0.75 个 数据 ,因此 


Оз = 289.995 + %15 x 10.00 = 290.75 美元 


因此 25% 的 员工 工资 不 多 于 268.25 美元 , 50% 的 员工 工资 不 多 于 279 06 美元 ,75% 的 员工 工资 
不 多 于 290.75 252. 


(b) 第 一 , 第 二 ,…… ;第 九 个 十 分 位 数 分 别 是 从 第 一 组 数 起 的 N/10,2N/10,…, 9N/10 个 数 .因此 
Di = 249.995 + 全 x 10.00 = 258.12 美元 
5 2. 
Р, = 259.995 + 10 X 10-00 = 265.00 美元 
Р» = 269.995 + 3 x 10.00 = 270.94 美元 
8 _. 
D, = 269.995 + 16 X 10-00 = 275.00 美元 
_ 14.5 — 
D; = 269.995 + “ig X 10.00 = 279.06 美元 


Ds = 279.995 + > x 10.00 = 283.57 美元 


D, = 279.995 + 1.3 x 10.00 = 288.21 美元 


Dg = 289.995 + Б x 10.00 = 294.00 美元 


Р» = 299.995 + °З x 10.00 = 301.00 美元 


所 以 10% 的 员工 工资 不 多 于 258.12 美元 ,20% 的 员工 工资 不 多 于 265.00 美元 ,…… ,90% 的 员 
工 工 资 不 多 于 301.00 美元 . 
这 里 第 五 个 十 分 位 数 是 中 位 数 .第 二 、 第 四 、 第 六 和 第 八 个 十 分 位 数 把 分 布 分 为 5 个 相等 的 部 分 ， 
称 为 五 分 位 数 ,经 常 应 用 在 实践 中 . 
3.45 求 习 题 3.44 分 布 的 (a) 第 35 个 和 (b) 第 60 个 百 分 位 数 . 
М E (a) 第 三 十 五 个 百 分 位 数 记 为 Ps, 是 从 第 一 组 数 起 第 3SN/100 = 35 x 65/100 = 22.75 个 数 
据 .如 习题 3.44， 





P3s = 269.995 + ETA x 10.00 = 272.97 美元 


这 意味 着 35% 的 员工 工资 不 多 于 272.97 美元 . 
(b) 第 六 十 个 百 分 位 数 Po = 279.995 + 2. х 10.00= 283.57 美元 .这 与 第 六 个 十 分 位 数 是 相等 的 . 
3.46 ”证 明 习 题 3.44 和 3.45 的 结论 可 从 百分率 卵 形 线 中 得 到 . 


ШЕ EF 


累积 频率 (%) 





250 260 270 280 290 300 310 320 
工资 (美元 ) 


图 3-5 


根据 习题 3.44 和 3.45 的 数据 得 到 的 相应 百分率 卵 形 线 如 图 3-5. 

第 一 个 四 分 位 数 是 卵 形 线 上 纵 坐 标 为 25% 的 点 的 模 坐 标 .同样 的 ， 第 二 和 第 三 个 四 分 位 数 分 别 
是 卵 形 线 上 纵 坐 标 为 50% 和 75% 的 点 的 横 坐 标 . 

十 分 位 数 和 百 分 位 数 都 可 用 类 似 的 方法 得 到 .例如 ,第 七 个 十 分 位 数 和 第 三 十 五 个 百 分 位 数 分 别 
是 卵 形 线 上 维 坐 标 为 70% 和 35% 的 点 的 横 坐 标 . 


仆 充 习题 
求 和 记号 
3.47 与 出 下 列 各 式 的 展开 式 ; 
(а) Уух +2); (с) > U,(U; + 6); (е) У)аху, 
б) зуд}, DDO- 


3.48 用 求 和 记号 表达 下 列 各 式 : 
(a)(X1 +3)? +(X2+3)2+(X3+3)2; 
(БАСУ, =a) + (У - а)? + + fasl Yi1s - a)’; 
(с) (2Х; -3Y1) + (2Х,-3Ү,) ++ (2XN 一 3YN); 
(D(X1/Y1-1)7+(X3/Y2-1)? +- + (Xe/ Ye -1); 


(е) 


2 


fit ++ fl 
3.49 证 明 У(Х, -1)? = ХХ} - 293X, +N. 
3.50 WHS (X +а)(у+6) = >)XY+a>yy+byX+Nab, 其 中 ob 是 常数 . 求 和 符号 表示 什么 ? 
3.51 两 个 变量 U 和 ,假设 U =3, U= -2，U3 = 5, V= – 4, V= -1, V3=6. 求 
(а) XUV, A (U+3)(V - 4), (с) У\у2, 
(dD (X UND VP, Уу UV, (0) У) (02 -2V + 2), (р) SU/V). 
3.52 已 知 5 X, = 7， D, Y, =-3, У\ XY, = 5, 求 (a) У\(2Х, + 5Y,); (b) 2 (x, -3)(2Y +1). 
算术 平均 
3.53 ”一 个 学 生 五 门 功课 的 成 绩 分 别 为 85,76,93,82 和 96. 求 成 绩 的 算术 平均 . 
3.54 一 个 心理 学 家 测 得 一 个 人 对 某 些 刺激 的 反应 时 间 分 别 为 0. 53， 0.46,0.50,0.49,0.52,0.53,0.44 和 
0.55 秒 . 求 这 些 反 应 时 间 的 算术 平均 . 
3.55 一 组 数 由 6 个 6,7 个 7,8 个 8,9 个 9 和 10 个 10 组 成 . 求 这 些 数 的 算术 平均 . 
3.56 一 个 学 生物 理 课 的 实验 、 报 告 和 背诵 部 分 的 成 绩 分 别 为 71,78 和 89, 
(a) 如 果 这 些 成 绩 的 权 分 别 为 2,4 和 5. 求 一 个 恰当 的 平均 分 . 
(b) 好 果 权 相等 ,那么 平均 分 是 多 少 ? 
3.57 3 个 经 济 学 教师 所 教 班级 平均 考试 成 绩 分 别 为 79,74 和 82, 班级 人 数 分 别 为 32,25 和 17 人 . 求 三 个 班 
级 的 平均 分 . 
3.58 一 个 公司 支付 给 所 有 员工 的 平均 年 薪 是 36 000 美元 . 文 付 给 男 员 工 和 女 员工 的 平均 年 薪 分 别 为 34000 
美元 和 40000 美元 . 求 男女 员工 人 数 的 百分比 . 
3.59 3.8 显示 的 是 某 公司 生产 的 缆绳 所 能 承载 的 最 大 负荷 量 , 单位 为 短 吨 (1 短 吨 = 2000 磅 ). 用 (a) “长 


方法 ”;(b) 编 码 法 求 平均 最 大 负荷 量 . 


表 3.8 
最 大 负荷 量 ( 短 吨 ) 










9.3~9.7 
9.8 一 10.2 5 
10.3 一 10.7 12 
10.8~11.2 17 
11.3 一 11.7 14 
11.8 一 12.2 6 
12.3 一 12.7 3 
12.8~13.2 1 
总 计 | 60 





3.60 用 (a) 长 方法 ";(b) 编 码 法 求 表 3.9 中 数据 的 X. 


表 3.9 
462 480 498 516 534 552 570 588 606 624 
f 98 75 56 42 30 21 15 11 6 2 


3.61 23.10 0 Г Да ЧЕТ ШЕН ЯЛЕ. ЖЖ ЕШ. 
3.62 计算 表 3.11 中 数据 的 算术 平均 ， 


表 3.10 表 3.11 













直径 (cm) 
0.7247 一 0.7249 
0.7250—0.7252 





10~15 以 下 











0.7253~0.7255 8 15—20 以 下 7 
0.7256~0.7258 15 | 

0.7259—0.7261 42 20-250 16 
0.7262 ~ 0.7264 68 25~30 以 下 12 
0.7265 ~0.7267 49 30—35 以 下 К 
0.7268 — 0.7270 25 

0.7271— 0.7273 18 35-40 以 下 5 


0.7274—0.7276 
0.7277—0.7279 
0.7280~0.7282 


40 一 45 以 下 






3.63 ”计算 习题 2.20 中 400 个 初中 生 每 周 看 电视 的 平均 时 间 . 
3.64 (a) 用 习题 2.27 得 到 的 频数 分 布 计 算 滚 珠 的 平均 直径 。 
(b) 用 原始 数据 直接 计算 平均 值 并 把 它 与 (a) 中 的 结论 作 比较 ,解释 差异 . 


中 位 数 


3.65 求 (a)5,4,8,3,7,2,9;(b)18.3,20.6,19.3,22.4,20.2,18.8,19.7,20.0 的 算术 平均 和 中 位 数 . 
3.66 求 习 题 3.53 中 成 绩 的 中 位 数 . 

3.67 求 习 题 3.54 中 反应 时 间 的 中 位 数 . 

3.68 求 习 题 3.55 中 数据 的 中 位 数 . 

3.69 根据 习题 3.59 中 表 3.8 计算 绕 强 最 大 负荷 量 的 中 位 数 . 

3.70 根据 习题 3.60 表 3.9 计算 分 布 的 中 位 数 党 . 

3.71 根据 习题 3.61 中 表 3.10 计算 锯 钉 顶端 直径 的 中 位 数 . 

3.72 根据 习题 3.62 中 表 3.11 计算 分 布 的 中 位 数 . 

3.73 表 3.12 给 出 了 1993 年 因为 心脏 疾病 而 死亡 的 人 数 . 求 死亡 年 龄 的 中 位 数 ， 


表 3.12 


死亡 数 ( 干 人 ) 





来 源 :美国 国家 健康 统计 中 心 , 美国 生死 统计 , 年鉴. 


3.74 根据 习题 2.31 的 数据 求 美 国人 口 年 龄 的 中 位 数 ， 
3.75 计算 习题 2.20 中 400 个 初中 生 每 周 看 电视 时 间 的 中 位 数 ， 


ХХ 


3.76 ЖК ‹а)7,4,10,9,15,12,7,9,7; ()8, 11, 4, 3,2, 5, 10,6, 4,1, 10, 8, 12, 6,5,7 的 算术 平均 中 信教 和 从 


77 
78 
79 
80 
81 
82 
83 
84 
85 


шч ш ш ы ш ш ш о ш 


3.86 


3.87 


数 . 

求 习题 3.53 成 绩 的 众 数 . 

求 习 题 3.54 反应 时 间 的 众 数 . 

求 习题 3.55 中 数据 的 众 数 . 

求 习题 3.59 中 缆绳 的 最 大 负荷 量 的 众 数 ， 

根据 习题 3.60 表 3.9 求 分 布 的 众 数 X. 

根据 习题 3.61 Æ 3. 10 求 锦 钉 顶端 直径 的 众 数 . 

求 习 题 3.62 中 分 布 的 众 数 ， 

求 习题 2.20 中 400 个 初中 生 每 周 看 电视 时 间 的 众 数 . 
(a) 表 2.15 年 龄 组 的 众 数 是 什么 ? 

(b) 表 3.12 年 龄 组 的 众 数 是 什么 ? 

用 本 章 公 式 (49) 和 (10) 计 算 下 列 习题 中 分 布 的 众 数 . 比较 你 用 公式 得 到 的 答案 . 
(a) 习 题 3.59;(b) 习 题 3.61;(c) 习 题 3.62;(d) 习 题 2.20. 
证 明 习 题 3. 32 结尾 所 给 的 结论 . 


几何 平均 


3.88 
3.89 
3.90 
3.91 
3.92 
3.93 


3.94 
3.95 
3.96 


求 (a)4.2 和 16.8;(b)3.00 和 6.00 的 几何 平均 . 

Ж 2,4,8,16,32 的 几何 平均 G 和 算术 平均 . 

求 (a)3,5,8,3,7,2;(b)28.5,73.6,47.2,31.5,64.8 的 几何 平均 . 

求 (a) 习 题 3.59;(b) 习 题 3.60 中 分 布 的 几何 平均 .证 明 这 些 数据 的 几何 平均 小 于 等 于 算术 平均 . 
如 果 一 种 商品 的 价格 在 4 年 间 翻 了 一 番 , 求 年 平均 增长 率 . 

1980 和 1996 年 美国 的 人 口 分 别 为 226.5x10s 和 266.0x105, 用 习题 3.38 所 给 公式 , 回答 下 列 问 题 . 
(a) 年 平均 增长 率 是 多 少 ? 

(Ъ) 估计 1985 年 的 人 口 数 . 

(c) 如 果 从 1996 到 2000 年 人 口 的 年 平均 增长 率 与 (a) 中 的 相同 ,2000 年 的 人 口 数 将 是 多 少 ? 
1000 元 本 金 以 年 利率 8% 进 行 投资 .如 果 最 初 的 本 金 不 被 取出 ,那么 6 年 后 本 息 和 是 多 少 ? 

如 果 在 习题 3.94 中 利率 按 季 以 复 利 计 息 ( 即 每 3 个 月 增长 2% ),6 年 后 本 息 和 是 多 少 ? 

大 两 个 数 的 算术 平均 是 9.0, 几何 平均 是 7.2. 求 这 两 个 数 . 


调和 平均 


3.97 
3.98 
3.99 


3.100 
3.101 


3.102 


3.103 


求 (a)2,3 和 6,(b)3.2,5.2,4.8,6.1 和 4.2 的 调和 平均 . 

求 0,2,4 和 6 的 (a) 算 术 平 均 ， (b) 几 何平 均 , (ec) 调和 平均 . 

ШЖ Xi Xa XX3, … 代 表 频 数 分 布 的 组 中 值 , 相应 的 组 频数 分 别 为 уу, у, уз, 证 明 分 布 的 调和 平均 
五 可 表示 为 


其 中 ,N = +++ = >f. 
根据 习题 3.99 (а) IE 3.59; (b) I 3.60 中 分 布 的 调和 平均 , 并 与 习题 3.91 作 比 较 . 
城市 А,В 和 C 相互 间距 离 相等 .一 个 乘 车 者 以 30 英里 /小 时 的 速度 从 A 到 8B, 以 40 英里 /小 时 的 速 
度 从 B 到 C, 以 50 英里 /小 时 的 速度 从 С 到 有 4. 求 整个 行程 的 平均 速度 . 
(a) 一 架 飞 机 分 别 以 vi, vs 和 оз 英里 /小 时 的 速度 飞行 di, dı 和 d; 英里 .证 明 平 均 速 度 V 满足 下 
式 : 

dı + d, + d3 а 4, а; 

V т 0] v у v3 

这 是 一 个 加 权 调 和 平均 ， 
(b) 如 条 di = 2500, d, = 1200, 4; = 500, v, = 500, оз = 400, v3 = 250.3 V. 


证 明 两 个 正 数 a ЖЬ 的 几何 平均 (a) 小 于 等 于 算术 平均 ;(b) 大 于 等 于 调和 平均 . 多 于 两 个 数 的 情况 
吃 ? 


均 方 根 


3.104 求 (a)11,23 和 35;(b)2.7,3.8,3.2 和 4.3 的 均 方 根 . 
3.105 证 明 两 个 正 数 a 和 的 均 方 根 (a) 大 于 等 于 算术 平均 ;(b) 大 于 等 于 调和 平均 .多 于 两 个 数 的 情况 呢 ? 
3.106 写 出 从 分 类 数据 中 求 得 均 方 根 的 公式 ,并 把 它 应 用 到 一 个 已 考察 过 的 频数 分 布 中 . 


四 分 位 数 ,十 分 位 数 和 白 分 位 数 
3.107 表 3.13 给 出 了 高 等 数学 期 未 考试 成 绩 的 频数 分 布 . (a) 求 分 布 的 四 分 位 数 ;(b) 解 释 每 个 分 位 数 的 含 


.108 
109 
110 
111 


Ww ыш w ы 


3.113 
‚114 
3.115 


Ыы 


X. 
表 3.13 

分 数 学 生 数 
90~100 9 
80—89 32 
70—79 43 
60— 69 21 
50— 59 11 
40—49 3 
30—39 1 

总 计 120 


求 (a) 习 题 3.59;(b) 习 题 3.60 中 分 布 的 四 分 位 数 Qi, Q, Qi .解释 每 个 分 位 数 的 含义 . 
六 种 不 同 的 统计 术语 搞 述 钟 形 频数 曲线 的 平衡 点 或 中 心 值 . 

根据 习题 3.59 中 的 数据 求 (a)Pi6;(b)Poo;(c) P2s;(d)Pzs, 并 解释 它们 的 含义 . 

(a) 所 有 的 四 分 位 数 和 十 分 位 数 可 以 表示 为 百 分 位 数 吗 ? 请 解释 原因 

(b) 所 有 的 四 分 位 数 都 可 以 表示 为 十 分 位 数 吗 ? 请 解释 原因 . 

根据 习题 3.107 的 数据 求 (a) 组 内 成 绩 居于 前 25% 中 的 最 低 成 绩 ; (b) 组 内 成 绩 居 王后 20% 中 的 最 高 

成 绩 .根据 百 分 位 数 解释 你 的 结论 ， 

用 (a) 百 分 率直 方 图 ;(b) 百 分 率 频数 多 边 形 ;(c) 百 分 率 卵 形 线 解释 习题 3.107 中 的 结论 . 

用 习题 3. 108 的 结论 解答 习题 3.113. 

(a) 写 出 一 个 类 似 于 本 章 (8) 式 那样 的 公式 对 频数 分 布 计算 百 分 位 数 . 

(b) 用 这 个 公式 来 求 习 题 3.110 的 解 并 说 明 公 式 的 用 途 . 


第 四 章 OEE p НТ, Ж а E ЭБ ВО ЛЕШ 


离 差 或 变 差 


数值 数据 围绕 其 平均 值 分 布 的 分 数 与 集中 程度 称 为 数据 的 离 差 或 变 差 .根据 不 同 度量 , 可 
以 定义 不 同 的 离 差 (或 变 差 ), 最 常用 的 有 全 距 , 平 均 偏 差 , 半 内 四 分 位 数 间 距 ,10 一 90 百 分 位 
数 间距 和 标准 差 . 


全 距 


一 组 数 的 全 距 是 这 组 数 中 最 大 的 数 与 最 小 的 数 的 差 . 
例 1 一 组 数 2,3,3,5,5,5,8,10,12 的 全 距 为 12-2=10. 有 时 ,全 距 也 可 简单 地 用 最 大 
与 最 小 的 数 来 表示 .例如 ,在 此 例 中 , 全 距 可 表示 为 2 到 12, 或 2 一 12. 


平均 偏差 
N SŽ Х,, Х,, +, Ху 的 平均 偏差 简 记 为 MD , 并 定义 如 下 : 





平均 偏差 (MD) = 2 х-Х| а) 


其 中 X 是 这 六 个 数 的 算术 平均 ( 自 本 章 起 ,大 多 将 算术 平均 简称 为 均值 ), | Xi -XIEX УХ 
差 的 绝对 值 . (一 个 数 的 绝对 值 是 这 个 数 去 掉 相 应 的 符号 后 的 数 , 用 两 条 竖 直 线 放 在 数字 两 边 
来 表示 .因此 ,| -4|=4,|+3|=3,16|=6,| 一 0.84|=0.84.) 

例 2 求 2,3,6,8,11 的 平均 偏差 . 


2+3+6+8+1l 
5 一 


MD = 261013 6131661186116 


r 
24!%-Х! уу-ур 
М и М Е 


Х = 6 


1-41I+1-31+101+121+15| 
p 5 


_4+3+0+2+5 
у 5 


如 果 Xis X2, е, X; 分 别 发 生 fis р, ea fi К, 平均 偏差 可 写 为 


К — 
DIR- 
MD = 一 六 = S -| X-X] (2) 


= 2.8 








其 中 N= х2}, = УР. 这 个 形式 对 分 类 数据 很 有 用 , 此 时 X 是 第 ; 组 的 组 中 值 ， f, 是 对 应 
的 组 频数 . 
有 时 , 可 以 根据 数据 与 中 位 数 或 其 他 平均 值 之 差 的 绝对 值 来 定义 平均 偏差 . 求 和 形式 


2 | Xj- a 1 有 一 个 有 趣 的 性 质 , 当 a 是 中 位 数 时 和 最 小 ( 即 关 于 中 位 数 的 平均 偏差 是 最 小 值 )， 
注意 , 使 用 术语 平均 绝对 偏差 比 平均 偏差 要 更 恰当 些 . 
半 内 四 分 位 数 间距 


一 组 数据 的 半 内 四 分 位 数 间距 或 半 内 四 分 距 用 Q 表示 , 定义 为 


Q = 28 (3) 


其 中 Qi 和 О; 分 别 是 数据 的 第 一 和 第 三 个 四 分 位 数 (见习 题 4.6 和 4.7). 有 了 时 也 会 使 用 四 分 
位 数 间距 Оз – Qi, 但 是 半 内 四 分 位 数 间距 更 多 地 作为 离 差 的 度量 . 


10~90 百 分 位 数 间 上 距 


一 组 数 的 10 一 90 百 分 位 数 间 距 定 义 为 
10 ~ 90 百 分 位 数 间 距 = Po - Ру (4) 
其 中 Pjo 和 Pw 是 数据 的 第 10 个 和 第 90 个 百 分 位 数 (见习 题 4.8). 半 10 一 90 百 分 位 数 间距 


(Po т P10) 不 经 常 使 用 . 


标准 差 
N 个 数 Xi, 义 ,,…, Ху 的 标准 差 用 * 表示 , 定义 为 


Sx, - X) X-X? r? 
а |а SR (5) 


其 中 , xz REX SHE 的 差 .因此 * 是 X; УХ (АЗАР, ШЖ ИКӘ ЗЕ. 
如 果 Х\, X>, е, Хк 分 别 发 生 f, Р, … к Ж, 标准 差 可 写 为 


DAX — Х)? ХХ)? 2 
全 一 - 200 ХУ Lf - /(х ху (6) 


其 中 N = Бу у= 如 了 .这 个 形式 对 分 类 数据 很 有 用 

有 时 在 定义 一 个 样本 数据 的 标准 差 时 , 表达 式 (5) 和 (6) 的 分 母 常用 (N - 1) (64 N, 因 为 
这 样 产生 的 值 是 总 体 标 准 差 的 较 好 估计 . 当 N 较 大 时 (NN >30), 这 两 种 定义 没有 什么 区 别 . 同 
笠 ,我 们 可 以 根据 第 一 个 定义 得 到 的 标准 差 乘 以 VN7CN -1 而 得 到 这 个 较 好 的 估计 值 因此 
”我 们 必须 掌握 好 (5) 和 (6) 式 . 


方差 


一 组 数据 的 方差 定义 为 标准 差 的 平方 ,用 (5) 和 (6) 中 的 s? 表示 . 
当 有 必要 区 别 总 体 的 标准 差 和 从 这 个 总 体 抽取 的 样本 的 标准 差 时 , 我 们 常用 符号 ， 代 表 
后 者 ,a( > 的 小 写字 母 ) 表 示 前 者 ,因此 s? 和 ог 分 别 表 示 样 本 方差 和 总 体 方差 ， 


计算 标准 差 的 快捷 方法 
(5) 和 (6) 式 可 分 别 写 为 下 列 等 价 形式 . 


N N 
> xX? EAE | 2 2 
一 ~ X X 一 一 - 一 
4 “үт =T - |40 2 =VX- X? (7) 

















K K . 

DIL (У! ух, }2 А 2 

24525 | 245, fX fX -一 一 一 
AON | = a 5А = у -xX (8) 














其 中 X? 表 示 X 平方 的 均值 , X 表示 х 的 均值 的 平方 (见习 题 4.12 M 4.14). 
ШЖ dj=X, -A RRX, 与 某 个 任意 常数 4 ШЖ, (7) 和 (8) 式 可 分 别 表示 为 

















Dai Dae 
àa” = [Da] ~ Vd -a (9) 
za ? Уа 2 

二 эн _ мм = Vd -a (10) 














(见习 题 4. 15 和 4. 17). 
当 数 据 整 理 成 组 距 大 小 相等 (= c) 的 频数 分 布 时 , 记 d, = си, 或 X;= A+cu, 则 (10) 式 变 


= c Ju? - и? (11) 


最 后 的 公式 提供 求 标准 差 的 快捷 方法 , 当 分 类 数据 组 距 大 小 相等 时 可 以 用 来 计算 . 这 称 为 编码 
法 ,并 且 它 与 第 三 章 计 算 分 类 数据 的 算术 平均 值 的 算法 是 很 相似 的 (见习 题 4.16 一 4.19)， 


标准 差 的 性 质 





uj (2 faj)? u? 


N 


S ful 
N 








1. 一 般 的 标准 差 可 定义 为 


>, (xX, - а) 
a $ = =y 


其 中 a 是 除 算术 平均 外 还 可 以 是 其 他 的 平均 值 .由 第 三 章 的 性 质 2 可 知 ,所 有 这 些 标准 差 的 
АЛМА а= Х 时 取 到 ,这 就 是 用 (5) 式 定义 标准 差 的 原因 .这 个 性 质 的 证 明 见 习题 4.27. 
2. 对 于 正 态 分 布 ( 见 第 七 章 ), 可 以 证 明 ( 如 图 4-1): 





(а)68.27% 的 数据 包含 在 X -s ЖХ + 5 之 间 ( 即 均值 两 边 一 个 标准 差 内 ). 

〈(b)95.45% 的 数据 包含 在 入 -25s MX +25 之 间 ( 即 均值 两 边 两 个 标准 差 内 ). 

\c)99.73% 的 数据 包含 在 X -3s ЖХ +3; 之 间 ( 即 均值 两 边 三 个 标准 差 内 ). 
对 于 微 斜 的 分 布 ,上述 百分比 近似 成 立 (见习 题 1.24). 
布 ), 它 们 的 方差 分 别 为 sf 和 52, 有 相同 的 均值 XX .那么 两 组 数 (或 两 个 频数 分 布 ) 的 组 合 的 或 
合并 的 方差 定义 如 下 : 

2 2 
52 = (1.2) 


这 是 两 个 方差 的 加 权 算 术 平均 .这 个 结论 可 推广 到 三 个 或 更 多 的 数组 ， 


Charlier 检验 


用 编码 法 计算 均值 和 标准 差 的 Charlier 检验 利用 了 下 列 性 质 ， 
210и +1) У) + Df= Ур + М 


У) ри +1)?= У\ flu? + 2и +1) = X fu +2 У) ји + Xf 
= X fu +2 У) ји + М 
(见习 题 4.20). 
Sheppard 方差 修正 
在 数据 分 组 时 ,标准 差 的 计算 会 出 现 误 差 (分 组 误差 ). 为 了 调整 分 组 误差 , 我们 使 用 公式 : 
修正 方差 = 分 组 数据 方差 - © (13) 


其 中 c 是 组 距 大 小 .修正 量 c?/12 称 为 Sheppard BE. 它 通常 用 在 两 个 方向 的 “尾部 " 趋 于 零 
的 连续 变量 的 分 布 中 . 

统计 学 家 常 考 虑 何 时 和 是 否 使 用 Sheppard 修正 .因为 它 经 常会 过 分 修正 , 所 以 在 应 用 前 
应 进行 细致 的 研究 .本 书 中 除非 特别 说 明 , 我 们 将 不 会 使 用 Sheppard 修正 


离 差 度量 间 的 经 验 关系 

对 于 微 斜 的 分 布 ,我 人 有 如 下 经 验 公式 ， 

平均 偏差 = $ 标准 差 
半 内 四 分 位 数 间 距 = 2. 标准 其 

这 是 因为 对 于 正 态 分 布 我 们 发 现 平均 偏差 和 半 内 四 分 位 数 间距 分 别 是 标准 差 的 0.7979 倍 和 
0.6745 fÈ. 
绝对 和 相对 离 差 ,变异 系数 

从 标准 差 或 其 他 离 差 度量 得 到 的 真实 变 差 或 离 差 称 为 绝对 离 差 . 然而 , 在 测量 距离 为 


1000 XREF, 10 英寸 的 变 差 (或 离 差 ) 产 生 的 影响 与 测量 距离 是 20 英尺 时 同样 的 变 差 产生 的 
影响 是 有 很 大 区 别 的 .这 种 影响 的 程度 可 用 相对 离 差 来 减弱 , 它 被 定义 为 


_ 绝对 离 差 
Й А28 = ру (14) 
如 果 绝 对 离 差 是 标准 差 *, 平 灼 值 是 均值 X, 那么 相对 离 差 称 为 变异 系数 ,用 V 表示 ， 
变异 系数 (V) = = (15) 


通常 表示 为 百分数 .其 他 可 能 的 定义 见习 题 4.30 
注意 ,变异 系数 与 所 用 的 单位 无 关 . 因此 , 在 不 同 单位 的 分 布 的 比较 中 , 这 会 是 有 益 的 但 
当 Хх 接近 于 零 时 , 变异 系数 会 失去 效用 


标准 化 变量 ,标准 分 数 


以 变量 X 的 标准 差 * 为 单位 来 度量 X 与 其 均值 立 之 间 偏 差 的 变量 。 称 为 标准 化 变量 , 即 
X-X 


$ 


ИЕА Ед ЖЕ (Б Еу ЕН З ЖЕШ). 
怀 准 化 变量 的 数值 称 为 标准 分 数 或 Z 分 数 .在 比较 分 布 时 有 很 大 用 处 (见习 题 4.31) 


(16) 


习题 与 解答 
$E 


4.1 Ж (а)12,6,7,3,15,10,18,5;(Ь)9,3,8,8,9,8,9,18 的 全 路 


解 F 在 两 组 数 中 , 均 有 全 距 = 最 大 值 - 最 小 值 =18-3=15. 然 而 ,正如 从 数列 (a) (b) 中 看 到 的 : 
(a)3, 5, 6,7,10,12,15,18;(Ъ)3,8,8,8,9,9,9,18 
(a) 的 离 差 比 (b) 的 要 大 .实际 上 ,(b) 的 大 部 分 由 8 和 9 组 成 . 
由 于 全 距 不 能 区 别 这 两 组 数 ,因此 在 此 例 中 它 不 是 离 差 的 一 个 良好 度量 . 当 极 值 存在 时 , 全 距 通 
常 都 不 能 很 好 地 度量 离 差 . 
一 个 改进 方法 就 是 把 极 值 3 和 18 去 掉 . 此 时 (a) 的 全 距 是 15 – 5 = 10,(b) 的 全 距 是 9-8=1, 这 就 
清楚 的 表明 (a) 的 离 差 比 (b) 的 大 .但 这 样 一 来 就 不 符合 全 距 的 定义 了 . 半 内 四 分 位 数 间 距 和 10—90 
百 分 位 数 间 距 就 很 好 地 弥补 了 这 一 问题 . 
4.2 根据 表 2.1 求 XYZ 大 学 学 生 身高 的 全 距 . 


解 F 对 于 分 类 数据 , 全 上 距 有 两 种 定义 方式 . 


解法 一 ZE = 最 高 组 组 中 值 -最低 组 组 中 值 
=73—61=12 英寸 
解法 二 全 距 = 最 高 组 上 组 界 -最低 组 下 组 界 


=74.5 一 59.5=15 英寸 
第 一 种 方法 在 某 种 程度 上 消除 了 极 值 的 影响 . 


平均 偏差 
4.3 求 习题 4.1 中 数据 的 平均 偏差 . 
Ж F (a) 均 值 为 
-tt t+ 0+18+5,% gg 
平均 偏差 为 | 
мр >) ХХ! 


_ 1129.5 1+16-9.51+17-9.51+13- 9.5. 
и 8 


115 - 9.51+110- 9.5 1+1 18 – 9.5 |+] 5 -– 9.5 | 
8 








+ 


_ 2.5+3.5+2.5+6.5+5.5+0.5+8.5+4.5 34 











8 = g = 4-25 
(b) Х= ”&3—55+559+8+9+18 9 
8 
X IX-X! 
MD = N 

_ _9-9!+13-9!+!8-9!+!8—9] 
Е 8 

19-9 1+18-91+19-91+118-9 | 

8 

0+6+1+1 + 

_ 6+1 1+0+1+0+2_,55 


平均 偏差 显示 了 (b) 的 离 差 比 (a) 的 小 . 

44 求 XYZ 大 学 100 个 男 同 学 身高 的 平均 偏差 (见习 题 3.20 表 3.2). 
解 Кё 根据 习题 3.20, 叉 =67.45 英寸 .把 数据 整理 在 表 4 1 中 .也 可 通过 编码 法 来 计算 平均 偏差 
(见习 题 4.47). 


_ 207\Х-Х\_ 226.50 


MD N = 2100 = 2.26 英寸 





表 4.1 


组 中 值 (X) | |Х-Х\=]|Х—-67.45| 频数 (了 ) 


61 
64 
67 
70 
73 


4.5 ”讨论 习题 4.4 中 学 生 身 高 落 入 区 域 (a)X+ 上 MP,(b)X+2MD，(c)X+3MD 中 的 百 分 
Ш. 


# Бе (а) Хх + Мр = 67.45 + 2.2608 65.19-69.71 英寸 的 区 域 ) .这 个 区 域 包括 第 三 组 所 有 学 生 





身高 (英寸 









DFIX-X!= 226.50 


ЖГ + Е х (65.5 – 6$.19) 倍 第 二 组 学 生 数 + + х (69.71 — 68.5) È S WAF = (h TAEAKE 3 


英寸 , 第 二 组 上 组 界 是 65.5 英寸 , 第 四 组 的 下 组 界 是 68.5 英寸 ) .在 区 域 X + MD 中 的 学 生 数 为 


42 + 9.31 „ 18 + 一 一 1.21 2 х 27 = 42 + 1.86 + 10.89 = 54.75 3% 55 


即 占 总 数 的 55%. 
(b)X +2Мр = 67.45+2х 2.26 = 67.45 +4.52(8| 62.93 一 71.97 英寸 的 区 域 )， 
EKR Х+2Мр 中 的 学 生 数 为 


ів - ®2-93— 62.5 x 18+ 42+ 27+ 也 .97 二 71.5 


即 占 总 数 的 86%. 
(«3-Х + 3Мр = 67.45 +3х 2.26= 67.45 + 6.78(8| 60.67-74.23 英寸 的 区 域 ). 
在 区 域 Х +3змр 中 的 学 生 数 为 


з -到 67 二 59.5x5+18+ q2 + 27 745 74.23 


即 占 总 数 的 97%. 
半 内 四 分 位 数 间 距 


4.6 R XYZ 大 学 学 生 身 高 分 布 的 半 内 四 分 位 数 间 距 ( 见 习题 4.4 表 4.1). 


Ж EF Qi=65. 5+2 х3= 65.64 英寸 , Оз = 68. 5+ 为 x3= 69.61 英寸 , 则 半 内 四 分 位 数 间距 


(或 半 内 四 分 距 ) 为 9= 200 - Qi )= 7 х (69.61 - 65.64) = 1.98 英寸 ,注意 ,这 里 有 50% 的 数据 
落 在 Qi M Оз 之 间 ( 即 , 50 个 学 生 的 身高 AF 65.64 和 69.61 英寸 之 间 ). 
RIES CQ + Q1) = 67.63 英寸 作为 集中 趋势 的 度量 ( 即 平均 身高 ). 可知 有 50% 的 身高 落 在 区 
+ 67.63 +1.98 英寸 之 间 . 
4.7 求 P&R 公 司 65 个 员工 工资 的 半 内 四 分 位 数 间 距 ( 见 习题 2.3 表 2.5). 


解 ES 根据 习题 3.44, О, = 268.25 元 , О, =290.75 元 .因此 , 半 内 四 分 位 数 间 距 Q = 109; - Q1) 


х8= 85.67 5 86 


х8= 97.33 8 97 


= -; (290.75 — 268.25) = 11.25 JÈ. 由 于 方 ( Q3+ Q1) = 279.50 元 ,我 们 可 下 结论 :50% 员工 工资 落 在 
X tt 279. 50 + 11.25 元 之 间 . 


10 一 90 百 分 位 数 间距 
4.8 求 XYZ 大 学 学 生 身高 的 10 一 90 百 分 位 数 间距 ( 见 表 2.1). 
解 ЮР Po=62. 5+2. х3= 63.33 英寸 , Poo= 68. 5+2 х3= 71.27 英寸 .因此 10—90 百 分 位 数 


间距 Poo- Pio=71.27- 63.33=7.94 英寸 . 由 于 方 (Poo+ Pio) = 67.30 英寸 , 广 (Po - Р) = 3.97 


英寸 ,我 们 知道 有 80% 的 学 生 身 高 落 在 67.30+3.97 英寸 之 同 . 


标准 差 


4.9 


求 习题 4.1 中 每 组 数据 的 标准 差 *. 


E EF (а) Х = С = 05 
[>)(х-Х)? 
л М 


(二 [2 - 9.5)? + (6 - 9.5)? + (7— 9.5)? + (3 - 9.5)? 


2 
+ (15 - 9.5) + (10 ~ 9.5)? + (18 – 9.5)? + (5 – 9.5)?] 


= v23.75 = 4.87 
< +3+8+8+9+8+9+18 72 
(b) y=? 3+8+8 2 8 = 12-9 


[>)(х-Х)? 
57 N 


= (HE0 -9+ G- 9+ (в- у + (8-9)? + (9—9) 


1 
2 


+ (8 - 9)? + (9-9)? + (18 - 9)? | 
= V15 = 3.87 
把 以 上 结果 与 习题 4.3 的 结果 作 比 较 ,我们 可 以 看 出 标准 差 确 实说 明 (b) 的 离 差 比 (a) 的 小 . 然 


而 , 极 值 对 标准 差 的 影响 比 对 平均 偏差 的 影响 大 得 多 .当然 ,由 于 在 计算 标准 差 时 离 差 进行 平方 运算 ， 
因此 这 也 是 意料 之 中 的 . 





4.10 ЩЩ Minitab 给 出 的 习题 4.1 中 两 组 数据 的 标准 差 在 下 面 给 出 .请 将 这 里 的 结果 与 习题 


4.9 的 结果 作 比 较 . 
MTB> print cl 
set 1 

12 6 7 3 15 10 18 5 
MTB > print c2 
set 2 

9 3 8 8 9 8 9 18 
МТВ >standard deviation cl 
Column Standard Deviation 
Standard deviation of setl = 5.21 
MTB > standard deviation c2 
Column Standard Deviation 
Standard deviation of set2 = 4.14 


解 EF Minitab 软件 使 用 的 公式 为 


Уух - х) 
= N-1 
因此 习题 4.10 的 标准 差 与 习题 4.9 的 不 同 . 如 果 我 们 在 习题 4 9 的 结果 上 乘 以 VN/VCN -1), 那么 


就 可 以 得 到 习题 4. 10 的 结果 . N = 8, VN7CNz- 1) = 1.069045, 对 于 第 一 组 数 1.069045 x 4.87 = 
5.21, 与 Minitab 给 出 的 标准 差 相 同 . 同 理 ,1.069045x3 87=4 14, 55 Minitab 给 出 的 标准 差 相 同 . 


4.11 È XYZ 大 学 100 个 男 同学 身高 的 标准 差 ( 见 表 2.1). 
解 ке 根据 习题 3.15,3.20 5] 3.22,Х =67.45 英寸 .数据 整理 在 表 4.2 中 . 


表 4.2 
组 中 值 _ 
X ~ 67.45 Х-Х)? 频数 ( 了) X-XV 
lid p o meme шу mmn 
60—62 -6.45 41.6025 208.0125 








63—65 64 11.9025 18 214.2450 
66 — 68 67 0.2025 42 8.5050 
69—71 70 6.5025 27 175.5675 
72—74 73 30.8025 8 246.4200 


М = У) = 100 | УКХ -XP = 852.7500 


< 一 
| (X- XF 
5 = LEXE - 832-1500 _ J 8.5275 = 2.92 英寸 


根据 分 类 资料 计算 标准 其 
4.12 (а) МЕНЯ: 
X? = 
(b) 用 (a) 中 公式 求 12,6,7,3,15, 10, 18,5 的 标准 差 . 
М EF (a) 根 据 定 义 














5 = -一 一 一 -一 一 
N 
因此 
1 2 (X-X) >ИХ?-2ХХ+Х')_ DIX? -28 уух + МХ? 
боол N 0 
X? X X? _ Е ҳ? Е 
- 之 -эх 24 „х= 25 соха + хз - Š - 52 
> xX? | Yy, 
_ y2? _ 
=X -X= AN - 45] 
或 


x? Х\2 — 
| 
К “四 一 ү D N 
注意 在 上 述 求 和 中 ,我 们 用 X REX, У Ку. 
另 解 
s2= (Х-Х) = Х?-2ХХ +X = Х?°-2ХХ + Ri 
= Х-2ХХ + X= Х?-Х? 


2 
DE- 220 102+ 62+ 72 +32 +152+102+182+52 912 


8 = 8 = 114 
ў = 22 _ 0+6+7+3+15+10+18+5 216, 
М 8 = в = 9.5 
因此 


s = JX? ~- X? = //114— 90.725 = /I3 75—487 
此 方法 可 与 习题 4.9(a) 作 比较 . 


4.13 ”修改 习题 4.12(a) 中 的 公式 ,以 便 可 以 应 用 于 不 同 X 值 的 频数 . 
解 S 恰当 的 修改 为 








如 习题 4.12(a), 由 于 


Ух - Хх) 
5> N 

















因此 
) ZKX-X DSX -2XX +X) Ууух 2х Уух + ХУ) 
к= мр 5 N 
DP SDR a D a ‚ DE _ 
= NA 
-a | a|’ 
N N 
或 
_ U (Уж) 
$ = N N 





注意 在 上 述 求 和 中 , 我们 用 хату Кх, 和 万 , DRED DAN, 

4.14 用 习题 4.13 的 公式 求 习题 4.11 表 4.2 中 数据 的 标准 差 . 
解 S 数据 整理 在 表 4.3 中 .其 中 x = (Ў) уХ)/М = 67.45 英寸 ,注意 这 种 方法 像 习 题 4.11 那 
样 会 有 复杂 的 计算 .习题 4.17 所 介绍 的 编码 法 可 减少 计算 量 . 





表 4.3 
身高 (英寸 ) | APEX) ЖКО) ух? 
60—62 61 5 18 605 
63—65 64 18 73 728 
66 一 68 67 42 188 538 
69 一 71 70 27 132 300 
72—74 73 8 42 632 
М = У\ ғ = 100 Ух? = 455 803 








fX? 2 
‚- 124 -| ж = /%95.803 67.45? = /8 5275 = 2.92 英寸 
М М 100 


4.15 如 果 d=X-A4 表 示 X 与 任意 常数 4A 的 差 ,证 明 


s= JA Df)? 
N N | 


ШЕ ES 由 于 d=X-AX=4+d,X=A+d( 见 习题 3.18), 因 此 





Х-Х=(А+4)-(А+4)=4-4 
应 用 习题 4.13 的 结论 并 用 а 和 了 分 别 代表 X AX, 


得 到 
МХХ) | fa- a) У) у? | ЭРЕ 
o N B N Е N IN 


ê= (X-X; =(4-4)? = а? – 28а 1 Д? 








ЭМЕ 


结果 取 正 根 . 
证 明 : 如 果 在 组 距 大 小 相等 (= c) 的 频数 分 布 中 , 每 个 组 中 值 X 有 关系 X=A+cu, 其 
中 A 是 某 个 给 定 组 中 值 ,那么 标准 差 可 写 为 


oe [EE HA, a 
-o [EE Er 


证 明 二 由 于 d=X-A=cu,c 是 一 常数 ,因此 由 习题 4.15， 


[Eu De |, E у Ум 
ү М -| | с М o| 


N N 


[BEZA 


男 证 我们 可 不 用 习题 4.15 HeRR НЕ ХА + си, X =A+cū,X-X=clu- 
и), 于 是 


2 





5 = 








= (х-Х%) = aau” 


= с? (u? – 2ии + й?) = ‹(и^-2и°-+ иы?) = с2(и? – 8?) 





得 到 s= e си! = o |20 (20) 


根据 (a) 习 题 4.15 的 公式 ，(b) 习 题 4.16 的 编码 法 求 XYZ 大 学 学 生 身高 的 标准 差 ( 见 
22.1). 


解 ES (a) 在 表 4.4 和 4.5 中 ,4 是 选 定 的 组 中 值 67. 在 表 4.4 中 ,d=X-A 都 是 组 距 大 小 <=3 


的 倍数 .在 表 4.5 中 消除 了 这 个 因素 .因此 , 表 4.5 的 计算 量 大 大 减少 (与 习题 4.11 和 4.14 相 比较 )， 
由 于 这 个 原因 , 可 尽 可 能 的 使 用 编码 法 . 


组 中 值 (X) 


61 
64 
A—>67 
70 


73 288 





>)/4? = 873 





= V8.5275 = 2.92 英寸 
(b) 见 表 4.5. 


组 中 值 (X) 








| X fu? Уз |? 97 (45) - _ 
$ = с N 7 |< = 3 100 1100 = 3 / 0.9475 = 2.92 英寸 








\ 
4.18 用 编码 法 求 P&R 公司 65 个 员工 工资 分 布 的 (a) 均 值 , (b) 标 准 差 (见习 题 2.3 表 2.4). 
Жо F 数据 整理 在 表 4.6 中 . 









А->275.00 
285.00 14 
~ 295.00 40 
305.00 45 





315.00 


>) fu 31 





(а)Х=А+ н =А+с = 275.00 + 10.00 x = = 279.77 美元 


М 


/„2_ 2 fu’ fu)? ? 
(b) s=¢e Vu’—-i =c эе (ом) = 10.00 | 上 (232) 

= 10.00 V 2.4341 = 15.60 美元 
4.19 表 4.7 显 示 了 某 小 学 480 个 学 生 的 IQ. 用 编码 法 求 (a) 均 值 ,(b) 标 准 差 . 


表 4.7 
组 中 值 (X) | 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126 
频数 (f) |4 9 16 28 45 66 85 72 54 38 27 18 11 5 2 


解 FEN 
го = ЖЕЙ 
© ЕЙ 


用 百分数 表示 .例如 ,一 个 8 岁 儿 童 (接受 某 种 教育 ) 的 智力 相当 于 一 个 10 岁 儿 童 的 智力 , 相应 的 Q 
是 10/8= 1.25 = 125% 或 简单 记 为 125, % 符号 不 言 自明 . 
为 了 求 表 4.7 中 IQ 的 均值 和 标准 差 ， 我 们 把 数据 整理 在 表 4.8 H, 


5 _ > fu 236 
=А+сй=А+ =94+4x < 
(ÞAX=A+cū=A+c М 94+ 4х 480 95.97 


(b) 


5 之 和 _| дм 
= сүи -ü = с М N 








= 4 4 (236). = 4 /6.8499 = 10.47 
Ж 4.8 
70 144 
74 225 
78 256 
82 252 
86 180 
90 66 
А — +94 0 
98 72 
102 216 
106 342 
110 432 
114 450 
118 396 
122 245 
126 2 128 
Charlier 检验 


4.20 ”运用 Charlier 检验 来 帮助 证 实习 题 4.19 中 (a) 均 值 , (b) 标 准 差 的 计算 . 
解 F 为 了 运用 Charlier 检验 , 表 4.9 由 表 4.8 而 得 (为 了 方便 ,第 二 列 照 写 ). 


表 4.9 


fry 


Е 
+ 
= 
| 








о © м С^ л A шэ кы к D 


2 18 162 
М = У) ў = 480 У) а +1) = 716 У; flu + 1)? = 4356 


(a) 由 表 4.9, У) flu + 1) = 716; 由 表 4.8, X) fu + N = 236 + 480 = 716. 这 是 均值 的 检验 . 
(b) 由 表 4.9, У) f(u + 1)? = 4356, Н 4.8, У) ји2 +2 У) ји + N = 3404 + 2 х 236 + 480 = 4356. 
这 是 标准 差 的 检验 . 

Sheppard 方差 修正 


4.21 应 用 Sheppard 修正 求 (a) 习 题 4.17, (Ь) 231 4.18, (c) 习 题 4.19 的 标准 差 . 
E F (a)s*=8.5275,c = 3. 修 正方 差 =s? - 2/12 = 8.5275 — 32/12 = 7. 7775. 修正 标准 差 = 
v 修正 方差 = V7.7775 =2.79 英寸 . 
(Ь)5? = 243.41, c =10. 修 正方 差 = s? - с2/12= 243.41 - 102/12 = 235.08. 修正 标准 差 = Е 
= V235.08 = 15.33 美元 . 
(с) 5? = 109.60, с = 4. EF Æ = 52 – c2/12 = 109.60 - 4/12 = 108.27. 修正 标准 差 = ТЕТЕ Ж = 
V108.27=10.41. 

4.22 求 习题 2.8 第 二 种 频数 分 布 ( 见 表 2.7) 的 (a) 均 值 , (b) 标 准 差 , (c)Sheppard 修正 标准 
Æ, (d) 根 据 原始 数据 得 到 的 真实 标准 差 . 
RO БР 数据 整理 在 表 4.10 Ф. 





> fu 





去 _ 二 9 _ 
(а) Х=А+а = А + с N = 149+9x g = 147.0 
(b) 


s= с Ми? ~ ш? = с 25 (Ул 
N N 
-9 号 -| 各 | = 9/237 = 13.78 


(c) 修 正方 差 =? – c/12=188.27 – 92/12 = 181.52 .修正 标准 差 =13 4 磅 . 


(d) 为 了 从 实际 数据 中 求 得 标准 差 , 最 好 从 每 个 数据 中 碱 去 一 个 怡 当 的 值 A, 比 如 A = 150, 然后 运用 
习题 4.15 中 的 方法 .4d=X-A=X-150 列 在 下 表 中 ， 





-12 14 0 -18 -6 -25 -1 7 
-4 8 -10 -3 -14 -2 2 -6 


18 -24 -12 26 13 -31 4 15 


从 中 我 们 得 到 Уа =- 128, У\а? = 7052. 


-一 一 4? 2 _ 2 
s = /4°- d? = 22 (а = 7052 _ | 128) = 166.06 = 12.9%% 


因此 , Sheppard 修正 在 这 里 提供 了 一 些 改进 ， 
离 差 度量 间 的 经 验 关 系 


4.23 ”根据 XYZ 大 学 学 生 身高 的 分 布 ,讨论 下 列 经 验 公式 的 合理 性 ; (a) 平 均 偏差 = 4 Е 
差 , (b) 半 内 四 分 位 数 间距 = 分 标 准 差 
Е ке (a) 由 习题 4.4 和 4.11, 平 均 偏差 二 标准 差 = 2.26/2.92 = 0.77, 接 近 于 人 ， 


(b) 由 习题 4.6 和 4.11, 半 内 四 分 位 数 间距 = 标准 差 = 1.98/2.92 = 0.68, 接近 于 - 


因此 ,经 验 公式 在 本 例 中 是 合理 的 . 
由 于 没有 相应 的 平均 偏差 或 半 内 四 分 位 数 间距 的 修正 , 在 上 面 我 们 没有 使 用 Sheppard 修正 标准 
差 . 


标准 差 的 性 质 


4.24 确定 习题 4.19 НЕ ТО ЛЕК (а)Х +з;(Ъ)Х +25;(с)Х +35 中 的 百分比 . 
Ж ФЕ (a)X+s=95.97+10.47, 即 区 域 是 85.5 一 106.4.IQ ERIR X +; 中 的 数目 为 


SE ESS х 45 + 66+ 85+72 + 54 + 10644104 x 38 - 339 





IQ 落 在 区 域 X +s 中 的 百分比 是 339/480 = 70.6%. 
(b) X +25 = 95.97 +2х 10.47, КЕ 75.0~116.9. IQ ÆR X +2; 中 的 数目 为 
76 – 75.0 
4 





х9+16+28+45+66+85+72 + 54 


+38 + 27+ 18 + 199—116 1 _ 451 


IQ ЛЕК X +2; 中 的 百分比 是 451/480 = 94.0%. 
(c) X + 35 =95.97 +3 х 10.47, KIRE 64.6~127.4.IQ {ЕК5 X +3; 中 的 数目 为 


480 _ 128 -127.4 


ОЖ ЕКА X +35 中 的 百分比 是 479.7/480 = 99.9%, 5 100%. 
(a),(b),《c) 中 的 百分比 分 别 与 正 态 分 布 对 应 的 百分比 68.27% ,95.45% ,99.73% 是 一 致 的 、 
这 里 我 们 没有 使 用 Sheppard 修正 标准 差 ,应 用 Sheppard 修正 的 结果 与 上 述 结果 相当 接近 . 注意 
上 述 结果 可 由 习题 4.32 表 4.11 得 到 . 
4.25 给 定数 列 2, 5,8, 11,14 和 2,8,14. 求 :(a) 每 组 的 均值 , (b) 每 组 的 方差 ， (c) 两 组 联合 的 
均值 , (d) 两 组 联合 的 方差 . 


# EF (9) 第 一 组 均值 = 5 (2+5+8+11+ 14) =8. ВИЙ =-1-(0+8+14)=8. 


x2 = 479.7 或 480 


(b) 第 一 组 方差 = 51-102 -8)2+ (5-8)5#+(8—-8)2+(11-8)2+(14-8)2]=18. 


第 二 组 方差 =s3= 方 [(2-8)?+ (8—8)*+(14~8)?]=24. 


(c) 两 组 联合 的 均值 
2+5+8+11+14+2+8+14 8 
5+3 р 
(d) 两 组 联合 的 方差 


s*= [(2 - 8)? + (5 – 8)2 + (8—8)2 + (11 - 8)? 
+.(14 - 8)? + (2 - 8)? + (8 – 8)? + (14 – 8)?]/(5 +3) 
= 20.25 
э EHAR 


2 = Mst t Ns? _ Sx18+3x24 _ 25 
№, + №, 5 +3 К 


4.26 HERZ] 2,5,8, 11,14 和 10,16,22, 回答 习题 4 .25 中 的 提问 . 


# F 两 数列 的 均值 分 别 为 8 和 16, 方差 分 别 为 5? = 18, s? = 24. 


+5+8+11+14+10+16+22 
联合 的 均值 = 人 11 


联合 的 方差 
= [(2- 11} + (5 – 11)? + (8 – 11)2 + (11-11)? + (14 - 11)2 
+ (10 — 11)? + (16 ~ 11)? + (22 – 11)2]/(5 + 3) 
= 35.25 
Nisi + №55 
№+ №, 


(a) 证 明 w?+ рш + а 当 且 仅 当 w = - 方 p 时 ,取得 最 小 值 ,其 中 р, а 是 给 定常 数 
(шй а), EES нб а= X M, 


>% -ay 


注意 , 由 于 两 数列 均值 不 同 , 因此 公式 52 = 在 这 里 不 能 采用 


(X 

或 简 ; ажа) 

取得 最 小 值 . 

证 明 EP (a) 我 们 知道 w?+ pw +g=[ wda) + -十 p?. 由 于 4 -二 pp? 是 常数 ,表达 式 当 


有 仅 当 w+ 方 p=0[ 即 w= -十 pj 时 ,取得 最 小 值 . 
b) 





20-а) У\(Х2 ~ 2aX + а?) _ 22Х2 – 2а УЈХ + Na? 
N N 


DX DX 
= а? – 2а N + 


把 最 后 一 项 与 w?+ pw + g 作 比 较 , 我 们 得 到 





w=a, p=-2 =, q= 


N 


2X Èx 
N 


根据 (а) 的 结论 , 当 a =- 二 = (У\х)/М = F, RARR ВМА. 


绝对 和 相对 离 差 , 变异 系数 


4.28 


电视 显像管 生产 商 制造 两 种 显像管 4 和 有 它们 的 平均 寿命 分 别 为 X = 1495 小 时 ， 


Хв = 1875 小 时 , 标准 差 为 ;。 = 280 小 时 ， s8 = 310 小 时 . 请问 哪 种 显像管 有 和 较 大 的 (a) 


绝对 离 差 , (b) 相 对 离 差 . 


解 EF (а)д 的 绝对 离 差 ;=280 小 时 , B 的 绝对 离 差 ss = 310 小 时 ,因此 B 的 绝对 离 差 比 A 的 


K. 
(b) 变 异 系数 


因此 A 的 相对 离 差 较 大 . 
用 未 修正 和 修正 标准 差 求 (a) 习 题 4. 14; (b) 231 4.18 中 数据 的 变异 系数 . 


М F (а) V( 林 修正 ) АЧЫ). 7 —0.0433- 4.39 


VEE = 六 修正 ) - 2-9. =0.0413=4.1% “(根据 习题 4.21(a)) 


(b) VRBE) - REE) - 7 = 0.196 = 19.6% 


ү@)- E) - 12-33 = 0.192 = 19.2% (根据 习题 4.21(b)) 





4.30 (a) 若 四 分 位 数 已 知 , 定义 一 组 数据 相对 离 差 的 度量 . 
(b) 用 习题 4.6 中 数据 来 说 明 (a) 中 定义 度量 的 计算 . 
# EF (a) 如 果 数 据 的 Q 和 Q 给 定 ,那么 方 (Qi + Q3) 是 数据 集中 趋势 (或 平均 值 ) 的 度量 ,而 
半 内 四 分 位 数 间距 О = S (Q ~ Qi) 度 量 的 是 数据 的 离 差 .因此 我 们 可 定义 一 个 相对 离 差 的 度量 : 
1 
ү = 2*@›-— @) _ Ө,—- ©, 
о = — 
100: + Q3) Qi + Ө» 
我 们 称 它 为 四 分 位 变异 系数 或 四 分 位 相对 离 差 系数 . 
Q- Q 69.61-65.64 3.97 | 
(b) Vo= O Оз =69.61+65.64 135.25 0:0293=2.9% 
标准 化 变量 , 标准 分 数 
4.31 一 个 学 生 数 学 期 末 成 绩 是 84, 该 门 功课 成 绩 的 平均 分 是 76, 标准 差 是 10. 她 物理 期 未 
成 绩 是 90, 该 门 功课 成 绩 的 平均 分 是 82, 标准 差 是 16. 她 在 哪 门 功课 中 名 次 更 前 ? 
E F 标准 化 变量 x = (X - Х)/: 是 根据 标准 差 * 来 度量 X БЕШ X 之 间 的 偏差 .对 于 数学 , > 
= (84 一 76)/10=0.8; 对 于 物理 , x = (90-82)/16=0.5. 因 此 , 这 个 学 生 的 数学 成 绩 高 于 平均 分 0.8 
个 标准 分 , 而 物理 的 标准 离 差 高 于 平均 分 0.5, 所 以 她 数学 名 次 更 靠 前 . 
Ж а -(Х- Х)/5 常用 来 进行 教育 测评 , 也 就 是 众所周知 的 标准 分 数 . 
4.32 (〈a) 把 习题 4.19 中 的 IQ 转化 为 标准 分 数 ;(b) 相 对 于 标准 分 数 ,建立 频率 图 . 


М EF (а) 转化 工作 在 表 4.11 中 进行 . 

IQ 8 +8 66,130 放 入 表 中 是 为 了 在 (b) 中 使 用 .这 里 没有 使 用 Sheppard 修正 ， 这 个 问题 的 修正 
得 分 与 表 4.11 所 示 的 一 样 . 
(b) 相 对 于 z 分 数 的 频率 图 (频率 多 边 形 ) 如 图 4-2 所 示 . 水 平 轴 把 标准 差 ， 作为 一 个 单位 .注意 这 里 
的 分 布 是 微 对 称 的 , 稍 向 右 斜 . 


表 4.11 X=96.0,s=10.5 


_ X-X 频率 
Ї . X-X = 频数 
| (FN/N(%) 








66 -30.0 — 2.86 0 0.0 
70 -26.0 -2.48 4 0.8 
74 -22.0 -2.10 9 1.9 
78 -18.0 -1.71 16 3.3 
82 — 14.0 ~ 1.33 28 5.8 
86 – 10.0 – 0.95 45 9 4 
90 -6.0 -0.57 66 13 8 
94 -2.0 -0.19 85 17.7 
98 2.0 0.19 72 15.0 
102 6.0 0.57 54 11.2 
106 10.0 0.95 38 7.9 
110 14.0 1.33 27 5.6 
114 18.0 1.71 18 3.8 
118 22.0 2.10 | 11 2.3 
122 26.0 2.48 5 1.0 
126 30.0 2.86 2 0.4 
130 34.0 3.24 0 0.0 





频率 (9) 
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全 距 
4.33 Ж(а)5,3,8,4,7,6,12,4,3 和 (b)8.772,6.453,10.624,8.628,9.434,6.351 的 全 距 . 
4.34 根据 习题 3.59 的 表 3.8, 求 最 大 负荷 景 的 全 距 . 
4.35 根据 习题 3.61 的 表 3.10, 求 锦 钉 直径 的 全 距 ， 
4.36 50 个 测量 值 的 最 大 值 是 8.34 FH. 如果 全 距 是 0.46 于 克 , 求 测量 值 的 最 小 值 . 
4.37 ”下面 的 表格 给 出 了 25 个 由 于 公司 裁员 而 失业 的 老 工 人 寻找 工作 所 需要 的 时 间 ( 星 期 ). 求 这 些 数据 的 
ФБ. 
13 13 17 7 22 
22 26 17 13 14 
16 7 6 18 20 
10 17 11 10 15 
16 8 16 21 11 
平均 偏差 
4.38 Ж(а)—18.2;(Ь) + 3.58; (с)6.21;(4)0; (е) —/2;(4)4.00 -2.36-3.52 的 绝对 值 . 
4.39 求 (a)3,7,9,S;(b)2.4,1.6,3.8,4.13.4 的 平均 偏差 ， 
4.40 KIE 4.33 中 数据 的 平均 偏差 . 
4.41 根据 习题 3.59 表 3.8, 求 最 大 负荷 量 的 平均 偏差. 
4.42 (a) 根 据 习 题 3.61 表 3.10, 计算 锦 钉 直径 的 平均 偏差 (MD). 
(Ж ТЕЖЕ КЫЕ(ОХ + мр), (X +2мр)#(Х +змр) 218109559. 
4.43 ”根据 (a) 均 值 , (b) 中 位 数 , 求 8,10,9,12,4,8,2 的 平均 偏差 .证 明 根据 中 位 数 而 求 得 的 平均 偏差 不 大 于 
根据 均值 而 求 得 的 平均 偏差 . 
4.44 根据 习题 3.60 表 3.9 的 分 布 , 求 (a) 关 于 均值 ， (b) 关 于 中 位 数 的 平均 偏差 .利用 习题 3.60 和 3.70 的 
结论 . 
4.45 根据 习题 3.62 表 3.11 的 分 布 ， 求 (a) 关 于 均值 , (b) 关 于 中 位 数 的 平均 偏差 ,利用 习题 3.62 和 3.72 的 
结论 . 
4.46 ”根据 习题 4.37 中 的 数据 , 求 平均 偏差 . 


4.47 ” 写 出 计算 (a) 关 于 均值 , (b) 关 于 中 位 数 的 平均 偏差 的 编码 公式 .应 用 这 些 公 式 证 明 习 题 4.44 和 4.45 
的 结论 . 


半 内 四 分 位 数 间距 


4.48 ”根据 (a) 习 题 3.59, (b) 习 题 3.60, (c) 习 题 3.107 中 的 分 布 , 求 半 内 四 分 位 数 间距 . 
4.49 根据 习题 4.37 所 给 数据 求 半 内 四 分 位 数 间 距 . 


4.50 证 明 在 任何 频数 分 布 中 落 在 区 间 广 (Q; + 0;) + 109; - Qi) 内 的 数据 为 50% .那么 区 间 Q + 
方 (Qs - Qi) 呢 ?证明 你 的 结论 ， 


4.51 (a) 如 何 根据 频数 分 布 画 出 相应 的 半 内 四 分 位 数 间 距 ? 
(b) 请 解释 半 内 四 分 位 数 间 距 与 卵 形 线 之 间 的 关系 . 


10 一 90 百 分 位 数 间距 


4.52 根据 (a) 习 题 3.59,(b) 习 题 3.107 中 的 分 布 ,计算 10—90 百 分 位 数 间距 , 并 解释 你 的 结论 

4.53 ”一 城市 家 庭 购买 支出 的 第 10 个 百 分 位 数 是 35500 美元 , 第 90 个 百 分 位 数 是 225 000 Жс. Ж 10—90 
百 分 位 数 间 距 并 给 出 包含 80% 购买 支出 的 间距 ， 

4.54 与 10 一 90 百 分 位 数 间距 相 比 ,20 一 80 百 分 位 数 间距 有 哪些 优势 和 劣势 ? 

4.55 用 (a)10 一 90 百 分 位 数 间距 , (b)20~80 百 分 位 数 间距 , (с) 25 一 75 百 分 位 数 间距 解答 习题 4.$1 .并 回 
管 (c) 与 半 内 四 分 位 数 间距 之 间 的 关系 ， 

标准 差 

4.56 Ж(а)3,6,2,1,7,5;(Ь)3.2,4.6,2.8,5.2,4.4;(с)0,0,0,0,0,1,1,1 的 标准 差 . 

4.57 〈a) 在 数组 3, 6,2, 1,7,5 中 的 每 个 数字 上 加 $, 得 到 8,11,7,6,12, 10. 证 明 两 组 数 有 相同 的 标准 差 和 不 

同 的 均值 , 并 说 出 均值 之 间 的 关系 . 
(b) 数 组 3, 6,2,1,7,5 中 的 每 个 数字 乘 以 2 再 加 上 5, 得 到 11, 17, 9, 7, 19, 15. 请 说 出 两 组 数 标准 差 和 
均值 之 间 的 关系 . 

(c) 通 过 具体 问题 (a) 和 (b) 揭 示 了 均值 和 标准 差 的 什么 性 质 ? 

4.58 求 等 差 数 列 4,10,16,22,…,154 的 标准 差 . 

4.59 (а) 27 13.59, (Ь) 27 3.60, (c) 习 题 3.107 中 分 布 的 标准 差 ， 

4.60 在 习题 4.59 的 每 个 部 分 中 , 用 实例 说 明 Charlier 检验 的 用 途 . 

4.61 KIE 2.17 分 布 的 (a) 均 值 ,(b) 标 准 差 ,并 解释 所 得 结果 的 含义 

4.62 ”如 果 数 据 服从 钟 形 分 布 ， 那么 标准 差 可 近似 表示 为 全 距 的 四 分 之 - .计算 习题 4.37 所 给 数据 的 标准 
差 , 并 与 全 距 的 四 分 之 一 作 比 较 . 

4.63 (a) 根 据 习 题 3.61 表 3.10, 求 钾 钉 直径 的 标准 差 ， 
(Ъ ТА АС X +,Х +2; 和 总 +3s 中 的 百分比 是 多 少 ? | 
(c) 如 果 数 据 服从 正 态 分 布 ,把 (b) 中 的 百分比 与 理论 上 推出 的 结果 作 比 较 , 并 解释 其 中 的 差异 ， 

4.64 ”应 用 Sheppard 修正 求 习题 4.59 中 每 部 分 的 标准 差 ， 并 讨论 在 每 种 情况 下 , 应 用 此 方法 是 否 恰当 . 

4.65 ”如 果 应 用 Sheppard 修正 ,那么 习题 4.63 的 结论 会 作 如 何 调整 ? 

4.66 (a) 求 习题 2.8 中 数据 的 均值 和 标准 差 . 
(b) 建 立 数据 的 频数 分 布 , 并 求 标准 差 . 
Cc) 比较 (a) 和 (b) 中 的 结果 ,讨论 应 用 Sheppard 修正 后 是 否 会 得 到 较 好 的 结论 。 

4.67 ”根据 习题 2.27 中 的 数据 解答 习题 4.66. 

4.68 (a) 有 NN 个 取 1 或 0 的 数 , 其 中 取 “1” 与 取 *0” 的 个 数 之 比 为 p:g(q=1 一 轧 ) .证明 这 组 数 的 标准 差 为 
/ ра. 
(b) 用 (a) 中 结论 解答 习题 4.56(c). 


4.69 (а) ЕН n “Жа,а+а, а +24, ---,а+ (п = 1)а( | у а, 公差 为 4 Ар) атна (n? 
- 1)4?. 


(b) 用 (a) 中 的 结论 解答 习题 4.$8.( 提 示 :1+2+3+…+(7 一 1)= 六 ma ~ 1),12+22+ 32+... + (п 


-D= nn —1)(2я-1)). 
4.70 推广 并 证 明 本 章 性 质 3, 即 (12) 式 ， 


离 差 度量 间 的 经 验 关系 


4.71 通过 比较 习题 4.59 得 到 的 标准 差 与 习题 4.41,4.42 和 4.44 对 应 的 平均 偏差 ,讨论 下 列 经验 关 系 是 否 


成 立 :平均 偏差 = 标准 差 .解释 可 能 出 现 的 差异 . 
4.72 ”通过 比较 习题 4.59 得 到 的 标准 差 与 习题 4.48 对 应 的 半 内 四 分 位 数 间 距 , 讨论 下 列 经 验 关 系 是 否 成 


立 : 半 内 四 分 位 数 间距 = 气 标准 差 .解释 可 能 出 现 的 差异 


4.73 ”你 认为 对 于 微 斜 的 钟 形 分 布 , 半 内 四 分 位 数 间 距 和 平均 偏差 之 间 存 在 何 种 经 验 关 系 ? 
4.74 ”近似 于 正 态 分 布 的 频数 分 布 的 半 内 四 分 位 数 间距 等 于 10. 那 么 (a) 标 准 差 , (b) 平 均 偏差 是 多 少 ? 


绝对 和 相对 离 差 ;变异 系数 


4.75 150 个 学 生 统 计 学 期 末 考 试 平均 成 绩 为 78, 标准 差 是 8. 0, 代数 学 期 末 考 试 平均 成 绩 为 73, 标准 差 是 
7.6. 哪 一 门 学 科 的 (a) 绝 对 离 差 ,(b) 相 对 离 差 更 大 ? 

4.76 Ж(а) 23 3.59, (b) JE 3.107 中 数据 的 变异 系数 . 

4.77 “一群 中 学 生 SAT 成 绩 分 布 的 第 一 个 四 分 位 数 是 825, 第 三 个 四 分 位 数 是 1125. 求 这 些 学 生 SAT 成 绩 
分 布 的 四 分 位 变异 系数 . 

4.78 对 于 15—24 年 龄 组 ,家 庭 收入 的 第 一 个 四 分 位 数 是 16500 美元 , 第 三 个 四 分 位 数 是 25 000 美 元 . 求 这 
个 年 龄 组 家 庭 收 入 的 四 分 位 变异 系数 ， 


标准 化 变量 , 标准 分 数 


4.79 在 习题 4.75 中 ,一 个 学 生 统计 学 得 75 分 , 代数 学 得 71 分 .请 问 他 在 哪 门 学 科 名 次 较 前 ? 
4.80 把 6,2,8,7,5 转化 为 标准 分 数 . 

4.81 证 明 一 组 标准 分 数 的 均值 和 方差 分 别 为 0 和 1. 用 习题 4.80 来 说 明 . 

4.82 (a) 把 习题 3.107 的 成 绩 转 化 为 标准 分 数 , (b) 相 对 于 标准 分 数 建立 频率 曲线 . 
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Ж 
如 果 Xi, Xote, Xn 是 变量 X М 个 值 ,定义 





DX 
Х = М СОМ ЗООМ 
为 了 阶 矩 . 当 ，= 1 时 , 一 阶 矩 就 是 均值 Х. 

r 阶 中 心 矩 定义 为 


(1) 


У(Х, -XY D(X - Хх)" 

ум = 

当 y=1 时 , ту = О( LJ 3.16). r=2 时 , m= 为 方差 . 
设 A 为 任意 给 定 的 一 个 数 ,关于 原点 4 г ВВЕ 


(X-XY (2) 


т, 一 


” _ 25l АА OO АА _ 7 
m, = “————— = А а 44— а (ХА) (3) 


其 中 4= 匀 ~ A 是 X 与 A 的 差 . 如 果 A=0,(3) 式 即 为 (1) 式 .因为 这 个 原因 , (1) 式 也 被 称 为 
М6. 


分 类 资料 的 矩 
如 果 Х|, Х,, с, Хк 发 生 的 频数 分 别 为 fis fas е, Р. CRESA 


K 


X = 








N = N = N (4) 
K 
mMm, = N = N = (X-X) (5) 
NS ухда 
m, = N = N = (X-A) (6) 


HPN = 217, = >) f. 对 于 分 类 资料 的 矩 计 算 , 上 述 公 式 是 很 有 益处 的 . 
жів] 
下 列 公 式 对 m, Wm, ROL: 


m= т? 一 mi 

ma3= ту – 3тут» + 2m? 

ma= m4- 4туіту + бт mó- 3m’ (7) 
等 等 (见习 题 $.5) .注意 ,对 = 和 -4 
分 类 资料 矩 的 计算 


前 面 儿 章 介 绍 过 用 来 计算 均值 和 标准 差 的 编码 法 是 矩 计算 的 短 方法 .由 于 Xi = А + си, 


(或 简 记 为 X=A+cu), 因 此 由 (6) 式 ,我 们 可 知 
2, Ји" 


т, = с" N = си 





再 由 (7) 式 ,就 可 求 得 m,. 
Charlier 检验 和 Sheppard 修正 
Нн ТЕ ЯЕ В) Charlier 检验 运用 了 以 下 性 质 . 
S fut1)= Уи + М 
Уа +1} = У) ра + 02У) уи + М 
Хи +1) = У) и? +3 У) и + ЗУ + М 


>X flu +1) = D Sut + 47У) fu t6) fu + АУ + М 
Sheppard 和 矩 修正 (第 71 页 上 思路 的 延伸 ) 如 下 所 示 : 


修正 的 т) = 72 一 方 c?, 修 正 的 M4 二 ma` 102, + Tat 


2 240 


ЖЕФ Ж НЕ 

为 了 避免 特殊 的 单位 , 我 们 定义 无 量 纲 矩 . 
其 中 5 一 / m2, 是 标准 差 . 由 于 т = (), т. = s“, 我 们 得 到 ау = 0, аз =]. 
偏 度 


(8) 


(9) 


(10) 


偏 度 是 一 个 分 布 中 不 对 称 程度 或 偏离 对 称 程度 的 反映 . 如 果 分 布 的 频数 曲线 (光滑 频数 多 
边 形 ) 右 边 的 尾部 比 左边 的 长 , 则 称 分 布 是 向 右 偏 的 或 有 正 偏 度 . 反之 , 则 称 分 布 是 向 左 偏 的 或 


负 偏 度 . 


对 于 和 斜 分 布 ,均值 和 众 数 都 落 在 尾部 较 长 的 一 边 ( 见 图 3-1 和 3.2). 因此 ,均值 与 众 数 的 


老 就 可 用 来 度量 不 对 称 性 .如 果 再 除 以 离 差 , 比如 标准 差 ， 就 可 得 到 偏 度 的 无 量 纲 形式 . 


pr- 均值 一 众 数 Х-и 
标准 差 5 


如 不 用 众 数 , 可 以 用 第 三 章 经 验 公式 (10)， 
_ 3( 均 值 - 中 位 数 ) _3(Х— 中 位 数 ) 
RE == = Р 


(11) 和 (12) 式 分 别称 为 Pearson 第 一 、 第 二 偏 度 系 数 . 
根据 四 分 位 数 和 百 分 位 数 可 定 义 其 他 偏 度 度量 ， 


д н 03—02) - (0-01) 0,-20,+ 0, 





Q3- ©, Q3- Q; 
10—90 百 分 位 偏 度 系数 = (Poo ~ Pso)— (Pso — Pio) _ Ро - 2Ps + Р 
Poo ~ Pio Poo — Pio 


也 可 用 无 量 纲 形式 的 三 阶 和 矩 来 度量 偏 度 ， 


EWE &Җ = = m, 一 тз — m3 
a3 53 (Jm)? Sm 








有 时 也 用 b = a? 来 度量 偏 度 .对 完全 对 称 的 曲线 ， 比如 正 态 曲线 ,a3 和 5 都 是 0. 


(11) 


(12) 


(13) 


(14) 


(15) 


峰 度 


峰 度 是 分 布 陡峭 程度 的 反映 , 通常 是 相对 于 正 态 分 布 而 言 . 有 一 个 相对 较 高 的 顶峰 的 分 
布 ,如 图 5-1(a), 称 为 尖峰 的 ,而 图 5-1(b) 顶 峰 较 为 平坦 , 称 为 遍 峰 的 .图 5-1(c) 所 示 的 正 态 分 


布 ,没有 较 高 和 较 平坦 的 顶峰 , 称 为 常 峰 态 的 . 


(а) 尖峰 的 (6) 扁 峰 的 (с) 常 峰 态 的 
图 5-1 


表示 为 无 量 纲 形 式 的 四 阶 中 心 矩 可 用 来 度量 峰 度 ， 
矩 峰 度 系数 = а, = = 一 4 (16) 


a4 也 常 记 作 ba. 对 于 正 态 分 布 ， b> = d4 =3. 因此 ， 峰 度 有 时 也 定义 为 (5， 3 ) . (2, T DREK 
就 意味 着 尖峰 分 布 , 取 负 的 就 意味 着 扁 峰 分 布 , 值 为 0 就 是 正 态 分 布 

另 一 种 度量 峰 度 的 方法 建立 在 四 分 位 数 和 百 分 位 数 的 基础 上 , 定义 为 
Q 
Poo 一 Pio (17) 
其 中 Q = CQ- Qi) 是 半 内 四 分 位 数 间距 . RIE к 称 为 百 分 位 峰 度 系数 ;对 于 正太 分布 
к =0.263( 208 5.14). 


Жы БШ, 偏 度 和 峰 度 


如 果 需 要 区 别 样本 与 总 体 的 和 矩 , 偏 度 和 峰 度 , 那么 习惯 上 用 拉丁 符号 表示 前 者 , 用 希腊 符 
号 表示 后 者 .因此 , 如 果 样 本 矩 表示 为 m,m, 则 相应 的 总 体 矩 表示 为 Hro pz. 下 标 通常 用 拉 
丁 符号 表示 . 

同样 的 , 如 果 样 本 偏 度 和 峰 度 分 别 表 示 为 a;, аа, 则 总 体 偏 度 和 峰 度 分 别 为 аз, 04. 

在 第 四 章 我 们 已 经 知道 样本 的 标准 差 和 总 体 的 标准 差分 别 表示 为 。 和 


к = 


习题 及 解答 


5.1 ЖЯ 2,3,7,8,10 的 (a) 一 阶 矩 , (b) 二 阶 矩 (с) = ИЖ, (аА). 
Ж EF (a) — Ж, RHA 


ХХ 2+3+7+8+10 30 
N 一 5 





Х = =$ =6 
(b) SREK 
y UX PAPIRER 226 g 
(с) 三 阶 矩 为 
Tt нюр 


(d) WREX 


X= 3318.8 
5.2 求 习 题 5.1 "НУ (а) 6, (ЪТ, (с) = ВНЖ, (а). 
解 IF (а) 
一 一 一 (X-X) 
m = 0) = 200020) 
— (2-6) + (3-6) + (7-6) + (8-6) + (010-6) _ 0 ə 
= z = = 
由 于 X -X=X-X=0( 见 习题 3.16), m; =0. 
(Ь) 
一 -一 一 (Х-Х)? 
m = Осуу - 2000-Х 


_ (2-6)°+(3-6)°+ (7-6)?°+(8—6)?°+ (10-6)? 46 
— = = 9.2 


5 
注意 , т, 就 是 方差 上 ， 
(с) 


А -XV 
my = RF - 20000 


102-6) + (3 – 6)? + (7-6) + (8-6) + (10-6) -18 
_ z = =- 3.6 
5 
(d) 
> (xX - Х)* 
Е М 


(2-6) + (3 – 6) + (7 – 6) + (8-6) + (10-6)* 
3 7-6) + (8-6)*+ (10-6) _ 610 


= 5 5 
5.3 求 习 题 5.1 中 数据 的 关于 4 的 原点 (a) 一 阶 矩 , (b) 二 阶 矩 , (c) 三 阶 矩 , (ORNE. 


解 EF (а) 





_ (2-4) + (3-4) + (7-4) + (8-4) + 00-4) 


5 


м 


(Ь) 


5 2)(Х - 4) 
mz = (X – 4) = = 


_ (2-4) + (3-4)? (7-4) + (8-4) + (10-4)? 66 
5 25 
(с) 


一 一 一 У(Х ~ 4) 
” _ 3 _ 4 


(d) 





1650 
5 
5.4 ”根据 习题 5.2 和 5.3 的 结论 验证 下 列 关 系 ， 


(a)m2= т — тү, (b) ms= m -3mm + 2 ті, 


| 


= 330 


(c)m4 = m4 — 4% т} + бт т» -3ті. 


解 S 根据 习题 5.3, 有 m=2, m3 三 13.2，m3 = 59.6, ms = 330. 所 以 


(а)т›=т›—- т2 =13.2—2°?=13.2-4=9.2 
(b) тз =тз—-3түт›+2тү 
= 59.6-3х2х13.2+2х 2° = 59.6 – 79.2 + 16= -3.6 
(с) ma = m4 – 4ті m, + 6m? т» – Зтў | 
= 330-4х2х59.6+6х2? х 13.2-3х2* = 122 
这 与 习题 5.2 的 结论 是 一 致 的 . 
5.5 ПЕ (а) т. = mi- т, (Ь) тз = m3 — 3mi m +2 тў, 
(c)ma= тд — 4m; m3 + 6m? ть — 3m’. 
ШЕ б 如 果 4=X-A, 那 么 X=A+d,X=A+aX-X=d- 了 因此 
(a)m2 =(Х-Х)?—(а-4)%*= 42—244 +4? 
= 42-24?%+ 42= dP- Å? = m,- m? 
(b)ms =(X- XY = (44) = (43—347 + 3442—49) 
= 43-3442 +343 - 23 = 4-34 42 +243= mi 3m’ т) +23 
(с) та = (ХХ) = (4-4) (d айда? +64247 dads 43) 
= 4*-424+64242-44*+4*=4*- 42 4+6? 22-32 
= тц 4тутз + 6m ту ~ 3mi4 


由 这 种 思想 ,我们 也 可 得 到 ms, ms 等 的 相似 结果 . 
分 类 资料 矩 的 计算 


5.6 Ж2Ј 3.22 中 身高 分 布 的 前 四 阶 中 心 矩 ， 
E F 数据 整理 在 表 5.1 中 , 从 中 我 们 可 以 看 出 ， 











, > fu 15 ‚з Хи, зз 
тү = ст = 3х тоо = 0.45 тз = с N =3 х 100 = 8-71 
2 -d4 
* __ ‚ Хм __ 2 97 _.. ОНА ЭКГ __ 4 253 _ 
т» = с N =3 x 100 = 8.73 тї = с N = 3 х 100 = 20:93 
因此 
m= 0 


m2= т — т? = 8.73 – 0.45? = 8.5275 
m3= ту — 3m m, + 2m? = 8.91 - 3 x 0.45 x 8.73 +2 x 0.45? = 2.6932 


т= та 一 4m m + 6 m? т» — 3л 


= 204.9 — 4 x 0.45 xX 8.91 + 6 х 0.45? x 8.73 - 3х 0.451 = 199.3759 








У\ fut = 253 






8 


5.7 24.19 4.7 中 分 布 的 (a) лз, (b) ть, (c) m3, (4) m, (е) ті, (£) тә, (g) m3, 
(h)ma, (DX ,(j)s , (К) Х2, (1) ХЗ. 





М SF 数据 整理 在 表 5.2 P. 














X fu’ 
70 5184 
24 5625 
78 4096 
82 2268 
86 720 
90 66 
А 94 0 
98 72 
102 864 
106 3078 
110 6912 
114 11250 
118 14256 
122 12005 
126 2 8192 
, fu 
(а) т; = -之 大 = 4х 226 = 1.9667 
fu? 
(b) т; = с? 2056 = 4? х 204 = 113.4667 
q 3 
fu 
(с) m3= c? 221 = 43 х 5123 = 857.0667 
> fu’ 
(Ф) m4= t 0 = де У 75 288 = 39 780.2667 
(е) m= 0 


(О m2= m, - m? = 113.4667 - 1.96672 = 109.5988 
(8) m3= m3 -3m m, + 2m? 

= 857.0667 — 3 x 1.9667 x 113.4667 + 2 x 1.96673 = 202.8158 
(h) m= тд – 4mims+ 6m? т – 3m = 35 627.2853 


>, fu 


N 








G) X=A+d=A+mi=A+c = 94 + 1.9667 = 95.97 


(G) s= Jm, = v109.5988 = 10.47 
(k) Х?= (А +4)? = А2 +2Ad+ d? = A? +242 + J A? +2Ат\ + т» 

= 94? + 2 x 94 x 1,9667 + 113.4667 = 9319.2063 或 (保留 四 个 有 效 数字 )9319 
(0 X= (А +4) = АЭ+зА?Дд+3А41+ 43 = А? +3А?Д +3Adi+ 45 

= A? +3A°m1 +3Ат» + т, = 915 571.9597 或 (保留 四 个 有 效 数 字 ) 915 600. 


Charlier 检验 


5.8 解释 在 习题 5.7 计算 中 Charlier 检验 的 作用 . 


ЙЕ ES 为 了 应 用 Charlier 检验 , 表 5.3 由 表 5.2 而 得 (为 了 方便 ,第 二 列 照 写 ). 
在 以 下 计算 中 , 第 一 式 取 自 于 表 5.3, 第 二 式 取 自 于 表 5.2. 每 组 计算 就 给 出 了 所 要 求 的 检验 . 


表 5.3 


«+! far! 
-20 190 


4 






85 
1152 
4374 
9728 
16875 
23328 
26411 
20480 
13122 






У\ fla +1)? 
= 4356 


У\ flu +1) 
= 17 828 


X flu +1) 
= 122 148 










N= Ў) = 480 |> flu +1) = 716 





Уи +1) = 716 

У; ји + N = 236 + 480 = 716 

У) и + 1)? = 4356 

У fu? +2 У\ уа + N = 3404 + 2 х 236 + 480 = 4356 

Хи +1) = 17 828 

2 fu’ +3), fu? +3 У) fu + N = 6428 + 3 х 3404 + 3 x 236 + 480 = 17 828 
У и + 1)* = 122 148 


Хп +A м + бууу? + 4У) и + м = 74 588 + 4 х 6428 + 6 х 3404 + 4 х 236 + 480 = 122 148 
Sheppard #15 


5.9 ”应 用 Sheppard 1Е (а) JE 5.6, (b) JE 5.7 ФЕН. 
解 S (a) 修 正 的 m= m,- с2/12= 8.5275 32/12 = 7.7775 


1 7 
修正 的 та= m- ст) + 210 


| 


-Lyg I уза 
199.3759 – = x 3 х 8.5275 + = X 3 


163.3646 


H 


Mis My 无 需 修正 . 
(b) 修 正 的 тә = тә – с?/12 = 109.5988 — 42/12 = 108.2655 


修正 的 m4= m,- Fem + -Ec 


— 35627.2853 – py x 42 X 109.5988 + ~ x 44 


240 
= 34 757.9616 
偏 度 
510 ” 求 P&R 公司 65 个 员工 工资 分 布 的 Pearson(a) 第 一 , (b) 第 二 偏 度 系数 (见习 题 3.44 
和 4.18). 
解 EF 均值 =279.76 美元 ,中 位 数 =279.06 美元 , 众 数 = 277.50 美元 ,标准 差 ;=15.60 美 元 . 因 
此 ， 
(a) 第 一 偏 度 系数 = ERA _279.76—277.50 -0.1448 或 0.14 
(第 二 偏 度 系数 = EPER) _3(279.76—279.06) = 0.1346 或 0.13 


如 果 应 用 修正 的 标准 差 ( 见 习题 4.21(b)), 这 些 系 数 分 别 变 为 
(а) HERR _ 279.76 277.500 паза 或 0.15 


BER s 15.33 
3( 均 值 ~ 中 位 数 ) 3(279.76- 279.06) _ 
(b)? A гы = 30279 10273 06) _ 0.1370 X 0.14 


出 于 系数 是 正 的 ,分 布 有 正 偏 度 ( 即 向 右 偏 》. 
5.11 求 习 题 5.10 中 分 布 的 (a) 四 分 位 , (b) 百 分 位 偏 度 系数 (见习 题 3.44). 

E F Ql=268.25 美元 , Q; = Ps = 279.06 美元 , Qi = 290.75 美元 , Pi = Di =258.12 美 元 ， 

P% = Do = 301.00 美元 . 

(a) 四 分 位 偏 度 系数 = 922921 Q _ 290.75 一 2X279.06+ 268.25 


О,-О, 290.75 — 268.25 = 0.0391 
э, _ Ро -2Pso+ Pio _301.00—2Х279.06+ 258.12 _ 
(b) 百 分 位 偏 度 系数 = Pa- P, = 30100258 120-0233 
5.12 Ж(а)хҮ7 大 学 学 生 身 高 分 布 ( 见 习题 5.6), (b) 小 学 生 IQ( 见 习题 5.7) 的 矩 偏 度 系数 
a3. 
Ж ES (a)m,=s*=8.5275, m3= -2.6932. 因 此 
аз = 3 = ————=%— = 26332 0.1081 或 -0.11 


з (Sm)? Í /8.5275)° 
如 果 应 用 Sheppard 修正 (见习 题 5.9(a)), 那么 


修正 的 = 2013 С 22.6932 __ (у 104) 8 0.10 
“35 (Л Е m) (77.7775)? 
(b) аз = 223 = — = — =——©027-$198 0.1768 3 0.18 


3 (Sm) (V109.5988) 
如 果 应 用 Sheppard 修正 (见习 题 5.9(b)), 那么 
тз 202.8158 
修正 的 a; = JEE s (108 2655)3 7 0: 1800 2R 0.18 
注意 这 里 的 两 个 分 布 都 是 微 斜 的 , (a) 中 分 布 向 左 斜 ( 负 偏 度 ), (b) 中 分 布 向 右 斜 ( 正 偏 度 ).(b) 
中 分 布 比 (a) 中 分 布 倾斜 些 , 即 (a) 中 分 布 比 (b) 中 分 布 对 称 些 , 从 (b) 的 偏 度 系数 绝对 值 比 (a) 的 偏 度 
系数 绝对 值 大 这 一 事实 中 也 可 看 出 . 








峰 度 
5.13 求 (a) 习 题 5.6,(b) 习 题 5.7 中 数据 的 矩 峰 度 系数 a4. 
E т (as == 9 =2.7418 或 2.74 


如 果 应 用 Sheppard 修正 (见习 题 5. 9(а)), 那么 


修正 的 m 163.36346 
修正 的 а, = 一 = 一 一 一 4 = 一 .230239 _ 可 
的 а, (修正 的 m.) (7.7775)? 2.7007 =X% 2.70 


л чл л әд 
jand 
~} 


(b) 24 4 m2 109.59882 
如 果 应 用 Sheppard 修正 (见习 题 5.9(b)), 那么 


ЛЕН) та 34 757.9616 
修正 的 а= (修正 的 ms)? 108.2655? 


由 于 正 态 分 布 a4= 3, 因此 (a)、(b) 两 个 分 布 相对 于 正 态 分 布 都 是 扁 峰 的 ( 即 没 有 正 态 分 布 那么 
陡峭 ). 

考虑 到 陡峭 程度 , (b) 近 似 正 态 分 布 的 程度 比 (a) 好 .然而 根据 习题 5.12,(a) 中 分 布 比 (b) 中 对 称 
些 ,因此 考 虚 到 对 称 性 , (a) 近 似 正 态 分 布 的 程度 比 (b) 好 . 
(a) 计 算 习题 5.11 中 分 布 的 百 分 位 峰 度 系数 к= Q/( Poo Puo); 
(b) 讨 论 它 与 正 态 分 布 的 近似 程度 . 
Ж ғ (а) = 2-93 - Qi) = $ Х (290.75 — 268.25) = 11.25 美元 , Poo - Pio = 301.00 — 258.12 
= 42,88 美元 ， 因此 此 一 Q/(Poo — Pio) = (0,262. 
(b) 由 于 正 态 分 布 的 < 是 0.263, 因此 给 定 分 布 是 常 峰 态 的 ( 即 与 正 态 分 布 差不多 尖 ), 分 布 的 峰 度 应 
与 正 态 分 布 的 大 致 一 样 .如 果 从 峰 度 来 考虑 ,我 们 相信 它 与 正 态 分 布 是 近似 的 . 


= 2.9653 或 2.97 


% 2) Ай 


ЖЖЖ 4,7,5,9,8,3,6 (а) — RE, (Ь) ИЕ, (с) н, (ау рч. 

求 习 题 5.15 (а) ЧН, (Ь) ЧС, (с) Е, (д) E. 

求 习题 5.15 中 数据 的 关于 原点 7 (а) ИРАН, (DONE, (с) Е, (DURE. 

根据 习题 5.16 和 5.17 的 结论 验证 下 列 关系 ， 

(а)т;›=т;- тї, (b) тз=тз -3тут + 2ті, (с)та= m4 – 4т'утз+ 6m? nm) — Зт". 
求 等 差 数 列 2,5,8, 11,14,17 KRUR E GHE. 

证 明 (a) mi = m3 + А2, (Ь) ә = m3at+ 3Ат» + АЎ, 

(с) т = m +4hm3+6h? тә + ht, 其 中 ,hh = m. 

如 果 关 于 原点 2 的 一 阶 矩 等 于 $, 那么 均值 是 多 少 ? 

如 果 关 于 原点 З 的 前 四 阶 矩 分 别 为 - 2, 10, — 25, 50, 求 相应 的 (a) 中 心算 ， (b) 关 于 原点 SHE, (c) 原 
AEFIA 0 的 和 矩 ) 

求 0,0,0,1,1,11 和 1 的 前 四 阶 中 心 矩 ， 

《a) 证 明 :ms= т – 5 тта + 10m? эз 一 10 тї т» + 4m’. 

(b) 写 出 一 个 关于 ms 的 类 似 的 公式 . 

有 NN 个 取 1 或 0 的 数 ,其 中 取 "1” 与 取 *0” 的 个 数 之 比 为 р:9(9=1- р). ЖХ (а) ym, (Ъ) тз, 
(с) тз, (9) та, FE 23 1 5.23 相 比较 . 


证 明 等 差 数 列 а, а+а,а+ 24, ---,а+ (n-1)d 的 前 四 阶 中 心算 为 ;mj =0, m= (п? - 1) 4°, тз =0, 


та= 51-012 - (3n? 一 7)d4. 与 习题 5.19 作 比 较 ( 见 习题 4:69).( 提 示 ;14+24+34+.… 十 (7 一 D= 


n(n- 1)(2п – 1) (3023р 一 1)). 


分 类 资料 的 矩 


5.27 


根据 表 5.4 的 分 布 求 相应 的 前 四 阶 中 心 矩 ， 


А. 
м 
中 上 一 | 一 


续 表 


X 了 
18 10 
20 7 
22 2 
总 计 30 


5.28 解释 在 习题 5.27 计算 中 Charlier 检验 的 作用 . 

5.29 用 Sheppard 修正 习题 5.27 得 到 的 和 矩 . 

5.30 (a) 不 用 Sheppard 修正 ,(b) 用 Sheppard 修正 计算 习题 3.59 中 分 布 的 前 四 阶 中心 矩 ， 

5.31 根据 习题 3.62 中 分 布 计算 (a) ту, (b) тз, (с) тз, (4) та, (е)Х, (0), (а) Х?, (Һ) ХЭ, (1) Х*, (3) 
(Х+1)Ў. 


偏 度 


5.32 (a) 不 用 Sheppard 修正 , (b) 用 Sheppard 修正 计算 习题 5.27 中 分 布 的 矩 偏 度 系数 az. 

5.33 ”计算 习题 3.59( 见 习题 5.30) 中 分 布 的 矩 偏 度 系数 a3， 

5.34 ”两 个 分 布 的 二 阶 中 心 矩 分 别 为 9 和 16, 三 阶 中 心 矩 分 别 为 -8.1 和- 12.8. 请 问 哪 个 分 布 向 左 斜 得 更 
多 ? 

5.35 求 习题 3.59 的 Pearson(a) 第 一 ， (b) 第 二 偏 度 系 数 , 并 解释 出 现 的 差异 . 

5.36 KIE 3.59 的 (a) 四 分 位 和 (b) 百 分 位 偏 度 系数 .与 习题 5.35 的 结果 作 比 较 ,并 作出 解释 . 

5.37 表 5.5 给 出 变量 X 的 三 种 不 同 分 布 .这 三 种 分 布 的 频数 分 别 为 ул, у» 和 fa 对 三 种 分 布 求 Pearson 第 
一 ,第 二 偏 度 系数 .在 计算 系数 时 ,可 应 用 修正 标准 差 . 





峰 度 


5.38 (a) 不 用 Sheppard 修正 , (b) 用 Sheppard 修正 计算 习题 5.27(a) 中 分 布 的 矩 峰 度 系数 . 
5.39 (a) 不 用 Sheppard 修正 , (b) 用 Sheppard 修正 计算 习题 3.59(а) 中 分 布 的 矩 峰 度 系数 . 
5.40 习题 5.34 中 两 个 分 布 的 四 阶 中 心 矩 分 别 为 230 和 780. 请 问 从 (a) 峰 度 ， (b) 偏 度 上 看 哪个 分 布 更 近似 于 正 态 分 布 ? 
5.41 习题 5.40 中 的 分 布 哪 一 个 是 (a) 尖 峰 的 , (b) 常 峰 态 的 , (c) 扁 峰 的 ? 
5.42 ”一 个 对 称 分 布 的 标准 差 是 5. 如果 要 使 得 分 布 是 (a) 尖 峰 的 , (b) 常 峰 态 的 , (c) 扁 峰 的 , 那么 四 阶 中 心 矩 的 值 应 是 多 
少 ? 
5.43 (a) 计 算 习 题 3.59 中 分 布 的 百 分 位 峰 度 系数 w. 
(b) 把 你 的 结果 与 正 态 分 布 的 理论 值 0.263 作 比 较 , 并 解释 原因 . 
(c) 你 如 何 把 这 个 结论 与 习题 5.39 的 结论 统一 起 来 ? 


第 六 章 初等 概率 论 





概率 的 定义 
概率 的 古典 定义 
假设 事件 Е 在 等 可 能 的 n 种 方式 中 可 以 以 h 种 方式 发 生 , 则 事件 发 生 ( 成 功 ) 的 概率 表示 
为 
p = P(E) = А 
此 事件 不 发 生 ( 失 败 ) 的 概率 表示 为 
q = P(Ẹ E) = 2 = 1-2 = 1-р = 1- Р(Е) 


则 p+g=1 或 P(E)+P( 非 5E)=1. 事 件 “ 非 E” 有 时 可 记 为 E. 
例 1 设 EE 为 事件 “ 撕 一 次 骨 子 出 现 3 或 4”. 角 子 共 有 六 种 下 落 方式 ,分 别 出 现 1,2,3, 
4,5 或 6, 如 果 般 子 是 均匀 的 ( 即 没 有 负重 ), 我 们 可 假设 六 种 下 落 方 式 是 等 可 能 的 .因为 E 可 


以 以 其 中 两 种 方式 发 生 , 所 以 р=Р(Е)= 2 = 1.3 或 4 不 出 现 ( 即 1, 2, 5 或 6 出 现 ) 的 概率 


ж а= Р(Е)=1-35= 5. 

注意 , 事件 发 生 的 概率 介 于 0 和 1 之 间 . 如 果 事件 必然 不 发 生 , 它 的 概率 为 0. 如果 必然 发 
生 ( 即 发 生 是 肯定 的 ), 它 的 概率 为 1， 

如 果 一 个 事件 要 发 生 的 概率 为 p, 则 赞同 它 发 生 的 胜 败 之 比 为 p: q( 读 作 “p 比 g”) ;否定 


它 发 生 的 胜 败 之 比 为 g:z. 这 样 掷 一 个 均匀 的 仙子 ,赞同 3 或 4 不 出 现 的 胜 败 之 比 为 gq:p = 
2, 


14. 
ТЗ =2:1(BP 2 1). 


概率 的 统计 定义 


概率 的 古典 定义 有 所 缺陷 “等 可 能 "这 一 词 模 糊 不 清 .事实 上 , 这 一 词 看 上 去 和 “等 概率 ” 
是 同 义 的 ,那么 我 们 实质 上 是 用 概率 来 定义 它 自己 ,这 就 成 了 循环 定义 .为 此 ,有 人 提出 要 给 概 
率 下 一 个 统计 学 上 的 定义 . 据 此 , 当 观 测 次 数 很 大 时 ,事件 的 估计 概率 或 经 验 概率 被 理解 为 事 
件 发 生 的 频率 .统计 定义 的 概率 即 为 观测 次 数 无 限 增 大 时 频率 的 极限 . 

例 2 MEHREN 1000 次 有 529 次 出 现 正面 , 则 出 现 正 面 的 相对 频率 为 529/1000 = 
0.529. 99095 1000 次 有 493 次 出 现 正面 , 则 抛掷 2000 次 出 现 正面 的 频率 为 ($29 + 493)/2000 
=0.511. 根 据 统计 上 的 定义 , 这样 继续 做 下 去 ,频率 最 终 会 和 一 个 数字 越 来 越 接 近 , 它 就 是 抛 
撕 一 次 硬币 出 现 正 面 的 概率 .从 上 述 结果 可 见 ,这 个 数字 应 该 在 0.5 与 某 个 有 效 数 字 之 间 .要 
想 获 得 更 有 意义 的 结论 , 还 要 做 更 多 的 观测 . 

虽然 统计 上 的 定义 在 实际 应 用 中 是 可 以 的 ,但 从 数学 的 观念 上 来 说 仍 存在 一 些 问 题 , 因为 
实际 的 极限 值 有 可 能 根本 不 存在 .为 此 ,现代 概率 论 已 在 向 公理 化 的 方向 发 展 ;也 就 是 说 , 并 没 
有 给 概率 在 理论 上 加 以 定义 ,就 如 同 几 何 学 中 点 和 线 没有 定义 一 样 . 


条 件 概 率 ,独立 和 不 独立 事件 


假设 有 E1, E2 两 个 事件 ,在 已 知 Ei 发 生 的 条 件 下 Е, 发 生 的 概率 记 为 P(E,|E1), 这 个 
概率 称 作 是 在 Е, 发 生 的 条 件 下 , Е, 发 生 的 条 件 概率 . 
WR Fi 是 否 发 生 并 不 影响 E, 发 生 的 概率 , 则 Р(Е,|Е,) = P(E,), 此 时 称 E, 和 下 ,是 


独立 事件 ; 否则 ,它们 是 不 独立 事件 . 
如 果 我 们 用 EE 表示 事件 “已 和 E 同时 发 生 ”, 有 时 称 复 合 事件 , 则 


P(EIE,) = Р(Е,)Р(Е» | Е,) (1) 
特别 地 , 对 于 独立 事件 ， 
Р(Е,Е,) = Р(Е,)Р(Е,) (2) 
对 于 三 个 事件 Е\, Е. 和 E, RIE 
Р(Е.Е,Ез) = Р(Е,)Р(Е» | Ei)P(Es | Е,Е,) (3) 


也 就 是 说 , Е, E, 和 E, 同时 发 生 的 概率 等 于 

(E, 发 生 的 概率 ) x (Ei 发 生 条 件 下 E, 发 生 的 条 件 概率 ) x (E, Е, 同时 发 生 条 件 下 Е; 
发 生 的 条 件 概率 ) 
特别 地 , 对 于 独立 事件 ， 

P(E, E2E3) = Р(Е,)Р(Е»)Р(Е;) (4) 

一 般 说 来 , 如 果 El，FE,，E;, …， Е.а 个 独立 事件 , 它们 发 生 的 概率 分 别 为 рү, р», 
Рэ, Pn ЖА Е,, Eze, Е, 同时 发 生 的 概率 是 pj psp3… pn. 

例 3 多 次 抛 撞 一 枚 硬币 , Е, 和 E, 分 别 表示 事件 “第 五 次 出 现 正 面 "和 “第 六 次 出 现 正 
面 ”. 则 EE 和 EE, 是 独立 事件 ， 且 第 五 次 和 第 六 次 都 出 现 正面 (假设 硬币 是 均匀 的 ) 的 概率 为 


1 1 1 
P(E,E2) = Р(Е,)Р(Е, -2 "2= 才 


例 4 如 果 A 将 存活 20 年 的 概率 为 0.7, B 将 存活 20 年 的 概率 为 0.5, 那么 它们 都 将 存 
活 20 年 的 概率 为 0.7 x0.5=0.35. 

例 5 假设 盒子 里 有 3 个 白 球 和 2 个 黑 球 ,从 中 无 放 回 地 取 球 . 设 Ei 为 事件 “第 一 次 取出 
HERR”, Е, 为 事件 “第 二 次 取出 的 是 黑 球 ". EE, 和 Е, 是 不 独立 事件 


第 一 次 取出 的 是 黑 球 的 概率 为 P(E1) =3 和 = 所 .在 第 一 次 取出 黑 球 的 条 件 下 第 二 次 取出 黑 


球 的 概率 为 P(Ez| Ei) = 了 + 了 = 二 ,那么 两 次 取出 的 都 是 黑 球 的 概率 为 


2 1 
P(E1E2) = Р(Е)Р(Е, | Е) = 2. 1 = 1 


互 不 相 容 事件 


如 果 两 个 或 多 个 事件 中 的 任意 两 个 事件 都 不 能 同时 发 生 ， 那么 称 它们 是 互 不 相 容 的 .因此 
E E, Е, 是 互 不 相 容 事件 , 则 P(EIE,)=0. 
MRH E ЈЕ, 表示 事件 “El ME, 中 至 少 有 一 个 发 生 ”， 则 
P(E, U Е,) = Р(Е,) + Р(Е,) - Р(Е,Е,) (5) 
特别 地 , 对 于 互 不 相 容 事件 ， 
P(E, U E,) = Р(Е,) + P(E,) (6) 
加 以 推广 可 知 ,如 果 BE, EE,,…, E, и 个 互 不 相 容 的 事件 , 它们 发 生 的 概率 分 别 为 p, 
Рэ, °› ba ШЕ, Es, E, 中 至 少 有 一 个 发 生 的 概率 为 pj + р, ++ bn. 
结果 (5) 也 可 推广 到 三 个 或 更 多 个 事件 (见习 题 6.38). 
例 6 从 一 副 纸牌 中 抽 牌 一 次 , ШЖ Е, 为 事件 “ 抽 到 A”, E2 为 事件 “ 抽 到 К” ,ШР(Е,) 


=, Р(Е;) = с = уң БУ ЖЕГЕ ЕПН А MK, 所 以 它们 是 互 不 相 容 的 , 则 抽 到 A 


~ Die 


P(E; + Е;) = P(E) + Р(Е,) = 1+ 12 2 


例 7 从 一 副 纸 牌 中 抽 牌 一 次 , 如 果 E 为 事件 “ 抽 到 А”, Е, 为 事件 “ 抽 到 黑 桃 ”. 因为 有 
可 能 抽 到 黑 桃 A, 所 以 Е, ME, 不 是 互 不 相 容 的 .那么 抽 到 A 或 黑 桃 的 概率 为 


4 13 1 16 4 
P(E; U Е) = Р(Е,) + Р(Е) —Р(Е,Е;) = +- = 5% = тз 


概率 分 布 
离散 型 


如 果 变 量 X 取 到 一 组 离散 值 Xi, Х,, 5, Х, 的 概率 分 别 为 pi, ро, з, рь, ШЧ ру + 
р + + рь = 1, 我 们 则 称 对 X 定义 了 一 个 离散 型 概率 分 布 . 当 Хо= X, X, e, Xk ВР 
p(X) 分 别 取 值 p1, p2，…, рь, ШИ p(X) 为 X 的 概率 函数 或 频率 函数 .由 于 X 可 以 以 给 定 概 
率 取 到 确定 的 数值 , 它 常常 被 称 为 离散 型 随机 变量 .随机 变量 也 称 为 机 会 变量 或 随机 变数 . 

ів ”投掷 一 对 仍 子 ,用 X 表示 所 得 数字 之 和 .X 的 概率 分 布 见 表 6.1. 例 如 , 所 得 数字 


之 和 为 5 的 概率 为 26 = 0; ВНЕР 900 次 我 们 预期 会 有 100 次 得 到 数字 之 和 为 5 


表 6.1 
Х 2 3 4 5 6 7 8 9 10 11 12 
Р(Х) | 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 


注意 ,这 有 点 类 似 于 将 频率 分 布 中 的 频率 换 为 概率 ,所 以 我 们 可 以 认为 概率 分 布 就 是 当 观 
测 次 数 很 多 时 频率 分 布 的 理论 上 的 或 理想 中 的 极限 形式 .因此 ,我 们 可 以 认为 概率 分 布 是 总 体 
的 分 布 ,而 频率 分 布 是 总 体 中 样本 的 分 布 . 

就 像 频 率 分 布 一 样 , 概率 分 布 也 可 用 p(X) 对 X 的 图 形 表 示 出 来 (见习 题 6.11). 

类 似 于 累积 频率 分 布 ,我 们 也 可 以 通过 累积 概率 得 到 累积 概率 分 布 .与 此 分 布 相关 的 函数 
有 时 称 为 分 布 函数 . 


上 述 思想 也 可 推广 到 变量 X 到 连续 值 的 情形 .从 理论 上 或 极限 上 来 看 , 频率 多 边 形变 成 
了 一 条 连续 的 曲线 (如 图 6-1), 用 方程 Y= p(X) 来 表示 .曲线 下 方 和 XX 轴 所 围 的 面积 为 1. 曲 
线 下 方 和 X 轴 上 方 在 直线 X= a 及 X=8 之 间 区 域 面积 (图 6-1 中 阴影 部 分 ) 表 示 XX 介 于 。 
Mo 之 间 的 概率 ,可 记 为 P(a<XX<b). 





K 6-1 


我 们 称 p(X) 为 概率 密度 函数 ,简称 为 密度 函数 . 当 密度 函数 给 定 后 ， 我 们 就 可 以 说 对 Х 
定义 了 一 个 连续 型 概率 分 布 .变量 X 被 称 为 连续 型 随机 变量 . 


和 离散 型 情形 一 样 ,我 们 也 可 定义 累积 概率 分 布 以 及 相关 的 分 布 函数 ， 
数学 期 望 

如 果 一 个 人 总 共 获 得 S 美元 的 概率 为 p, 则 他 的 数学 期 望 (或 简称 期 望 ) 定 义 为 pS. 

例 9 一 个 人 获得 10 美元 奖金 的 概率 为 5 ,那么 他 的 期 望 是 二 x 10 美元 = 2 美元 ， 

可 以 很 容易 地 将 期 望 的 概念 加 以 扩展 .如 果 X 表示 一 离散 型 随机 变量 , 它 分 别 以 概率 
Р\,рә,'› Ph 取 到 值 Xi， Х„, МЫР Х,, 其 中 pit р; + 十 P = 1, П] X 的 数学 期 望 ( 简 称 为 X 
的 期 望 或 均值 ) 用 下 (X) 表 示 , 定义 如 下 


k 
E(X) = рХ, + paX2 + 十 р,Х, = Ур; j = >, px (7) 
J=1 


如 采用 频率 f,/N 代替 期 望 中 的 概率 p,, 其 中 N = У) у, ШАНК (У) ук) /N, 这 正 
Ж X1, Xat, Xi 分 别 以 这 些 频率 出 现 的 一 个 容量 为 N 的 样本 的 均值 叉 . 当 N 越 来 越 大 时 ， 
频率 户 / N 越 来 越 接近 概率 请 .因此 我 们 可 以 把 E(X) 理 解 为 提供 样本 来 源 的 总 体 的 均值 .如 
果 样 本 的 均值 记 为 m, 则 可 用 相应 的 希腊 字母 и 表示 总 体 的 均值 . 

也 可 定义 连续 型 随机 变量 的 期 望 ,但 定义 中 要 用 到 微 积 分 . 


总 体 均值 和 方差 与 样本 均值 和 方差 的 关系 


如 果 我 们 从 总 体 中 随机 抽取 一 个 容量 为 N 的 样本 ( 即 我 们 假定 抽 到 各 样品 是 等 概率 地 )， 
则 样本 均值 m 的 期 望 值 是 总 体 均 值 .. 

但 是 这 并 不 表明 样本 的 任何 量 的 期 望 值 都 等 于 总 体 的 相应 量 . 比如 说 , 我 们 前 面 定义 的 样 
本 方差 的 期 望 值 就 不 等 于 总 体 的 方差 , 而 是 方差 乘 以 (N -1)/N. 因此 有 些 统计 学 家 就 定义 样 
本 方差 是 普通 方差 乘 以 N/(N -1). 


组 合 分 析 


为 了 求 得 复杂 事件 发 生 的 概率 ,常常 要 列举 不 同 的 情况 ， 而 这 些 都 是 困难 而 烦琐 的 .要 简 
化 这 些 工作 , 就 要 用 到 组 合 分 析 中 的 一 些 基 本 原理 . 


基本 原理 


如 采 一 个 事件 可 以 以 n 种 方式 中 的 任 一 种 方式 发 生 ， 并 且 该 事件 发 生 时 引起 另 一 事件 
以 по 种 方式 中 的 任 一 种 方式 发 生 ， 则 两 个 事件 可 以 按 某 种 特定 顺序 都 发 生 的 方式 有 nin 
种 . 

例 10 如 果 有 3 个 人 竞选 省 长 ,5 个 人 竞选 市 长 ， 那么 产生 这 两 个 职位 的 方法 共有 3x5 
= 15 种 . 


п 的 阶乘 
п 的 阶乘 记 为 21 , 定义 为 
n'!=n(n—-1)(n-2)=1 (8) 


W 5!=5x4x3x2x1=120, 4! X31=(4X3x2x1)Xx(3Xx2x1)=144. 为 方便 起 见 ， 
定义 01=1. 


排列 


从 个 不 同 物体 中 一 次 取出 x 个 物体 按照 一 定 的 顺序 排 成 一 列 称 为 从 个 物体 中 取出 ， 
个 物体 的 排列 , 简称 为 n Pr 的 排列 .中 取 / 的 排列 数 记 为 ,P,, P(n, r) 或 P,,, 定 义 为 


Ро пбн = Dn —2)(я =r t1) = ү (9) 


特别 地 , n 中 取 的 排列 数 为 
Pa = п(п = 1) (и -2):…1=n! 
例 11 从 字母 a, b 和 c 中 一 次 取出 两 个 的 排列 数 是 ,P,=3x2=6, 它 们 是 ар, ba, ас, 
са, bc Ж ср. 
ДЖ п 个 物体 中 分 别 有 n1, по, ~, nx 个 是 相同 的 , 则 л 个 物体 的 排列 数 是 


n! (10) 


其 中 n=nitnt' ъп. 
例 12 在 单词 statistics 中 有 3 个 ;, 3 个 1:, 1 个 a, 2 个 ;和 1 个 c , 则 这 个 单词 中 的 字 
母 的 排列 数 是 


10! 
3! 3! 1! 2! 1! 


= 50 400 
组 合 
从 个 不 同 的 物体 中 一 次 取出 x 个 物体 组 成 一 组 而 不 考虑 它们 的 顺序 如 何 , ЖЫ n 个 


物体 中 取 > 个 物体 的 组 合 , 简称 为 ”中 取 > 的 组 合 .n 中 取 y 的 组 合 数 记 为 | "| , 定义 为 








n пбп- l)en- r+1) _ п! 
"= ч r! - ra 一) (11) 
例 13 MÆ a, b 和- 中 一 次 取出 两 个 的 组 合 数 是 
31 3x2 _ 
НЕ п 53 


它们 是 аЬ, ас 和 &c .注意 到 аЬ 和 ba 是 相同 的 组 合 ， 但 却 是 不 同 的 排列 . 
n 1 的 Stirling 1857 


当 ”很 大 时 , 直接 计算 n! 是 不 切实 际 的 .这 时 , 要 用 到 James Stirling #8 А20; 
n! œ /2лпп"е" (12) 


其 中 e=2.71828… 是 自然 对 数 的 底 (见习 题 6.31) 
概率 和 集合 论 的 关系 


在 现代 概率 论 中 ,我 们 把 一 次 试验 的 所 有 可 能 结局 (或 结果 ) 都 看 成 样本 空间 S( 可 以 是 一 
维 ,二 维 ,三 维 ……) 中 的 点 .如 果 S 中 只 包含 有 限 个 点 ,那么 对 于 每 一 个 点 可 用 一 个 非 负数 与 
之 相对 应 ,使 得 与 所 有 点 对 应 的 数 之 和 为 1, 这 些 数 就 称 为 概率 . 事件 是 S 中 后 的 集合 (或 集 )， 
如 图 6-2 中 El 或 E,, 这 种 表示 集合 的 图 叫做 欧 拉 图 或 文 氏 图 ， 
事件 E UE, 是 一 个 点 集 , 其 中 的 点 必 至 少 居于 Е, E, 中 的 一 个 .而 事件 E E, 是 由 Ei 
和 E: 的 公共 部 分 构成 的 点 集 . 一 个 事件 如 Е, 的 概 
率 就 是 集合 Е, 中 所 有 点 的 概率 之 和 . 类 似 地 , E, U 
E: 的 概率 P(E1UE,) 就 是 集合 E UE, 中 所 有 点 的 
ВКО WR E ME, 没有 公共 点 ( 即 事件 是 互 不 
相 容 的 ), 则 Р(Е, ЏЕ,) = Р(Е,) + Р(Е,). WREE 
MARHA, Д P(E, UE) = P(E) +Р(Е,) - 
P(E Е). 
ПЕЦЕ 称 为 两 个 集合 的 并 . ESEE 
为 两 个 集合 的 交 , 有 时 也 记 为 E N E. 推广 到 多 于 
两 个 集合 的 情况 , 我 们 可 用 记号 Е, ПЕ, ПЕ, 代替 





E EE}. 





符号 作用 于 表示 不 含 任何 点 的 集合 , 称 为 空 集 . 这 种 集合 所 对 应 的 事件 发 生 的 概率 为 0 


(БП Р(@)=0).Ш Ж E ЖЕ, 没有 公共 点 , 则 写作 玉 1E;= 名 ,也 就 是 说 它们 对 应 的 事件 是 互 
不 相 容 的 , 因此 P(E,E,)=0. 


应 用 这 些 现代 的 观念 , 随机 变量 就 是 定义 在 样本 空间 的 每 一 个 点 上 的 函数 .例如 ,习题 





6.37 中 的 随机 变量 是 每 个 点 的 坐标 之 和 . 


当 S 中 有 无 限 个 点 时 , 可 以 用 积分 的 概念 将 上 述 理论 加 以 扩展 . 


习题 及 解答 


概率 的 基本 法 则 


6.1 


6.2 


6.3 


求 下 列 每 个 事件 发 生 的 概率 p 或 其 估计 量 ，: 

(а) 95—00, EMAX. 

(b) 抛掷 均匀 硬币 两 次 ,至 少 一 次 出 现 正面 . 

(с) 从 一 副 洗 好 的 52 张 牌 中 抽取 一 张 , 抽 到 A 或 方块 10 或 黑 桃 2. 
(d) 抛 却 一 对 均匀 的 山 子 一 次 , 出 现 的 数字 和 为 7. 

(е) ПАИ ИЕ р 100 次 有 56 次 正面 向 上 ,而 下 一 次 出 现 反面 . 


解 ES (а) 在 六 种 等 可 能 的 情形 中 , 该 事件 包括 三 种 情形 (1,3 或 5 出 现 ), 则 р = 二 = 六. 
(b) 用 互 记 "正面 ”, 工 记 “ 反 面 ”, 则 抛掷 两 次 会 等 可 能 地 出 现 四 种 情形 ; HH, HT, TH MTT. ZE 
件 包括 前 三 种 情形 , 则 = 之， 

(с) 在 等 可 能 的 52 种 情形 中 , 该 事件 可 以 以 六 种 方式 发 生 ( 黑 桃 A, ЖА, ДЕ A, 方 块 A, 方 块 10， 
ур 2), Д р= 0. 3. 


(d) ЈИЕ ВРАТА ЭЗ ARTA EEA Ж ЖЖ, 因此 能 列举 出 6x6= 36 种 等 可 能 
出 更 的 情形 , 可 记 为 (1,1), (2,1),(3,1),…,(6,6). 其 中 有 六 种 情形 的 数字 和 为 7, 分 别 为 (1,6), (2, 
5), (3,4), (4,3), (5,2) 和 (6,1)( 见 习题 6.37(a)), 则 p= 起 = 十. 

(е) У 100 次 有 100-56=44 次 反面 向 上 ， 所 以 下 一 次 出 现 反 面 的 估计 (或 经 验 ) 概 率 是 出 现 反 
面 的 频率 44/100= 0.44. ` 

К ЕИ — ЖОШ ПЖ —1- Б.Ш Е, REFE HE ЕТЕ АЈ Е”, Н Е, 
Rm ЕВН 3 或 6 出 现 ”, 用 语言 叙述 下 列 记号 的 意义 . 

(а) Е, (b) Е, (с) ЕЕ, 


(d) Р(Е,Е,) (е) P(E] E2) (Р) P(E UE) 
解 F (а) Ле ШП {1 , H PBE ПН] БЕТЕН PA; 
(b) 不 论 硬币 如 何 , HRT 1, 2,4285 Ш, 
(с) 抛掷 硬币 时 正面 向 上 且 抛 掷 般 子 时 3 或 6 出现 ; 
(d) 硬币 正面 向 上 且 货 子 出 现 1，2，4 或 $ 出 现 的 概率 ， 
(е) EE ARTHA 3 3 6 时 硬币 正面 向 上 的 概率 ， 
(f) 硬币 反面 向 上 或 般 子 出 现 1，2,， 4 或 5 的 概率 . 
从 一 个 装 有 6 个 红 球 ,4 个 白 球 和 5 个 蓝 球 的 盒子 里 随机 地 抽取 一 个 球 . 求 取 到 下 列 球 
的 概率 :(a) 红 球 , (b) 白 球 , (c) 蓝 球 ， (d) 不 是 红 球 , (e) 红 球 或 白 球 . 
解 F 用 RR,W 和 B 分 别 表示 事件 “ 抽 到 红 球 ”， “ 抽 到 白 球 "和 “ 抽 到 蓝 球 ”. 则 


(a) P(R)= 抽 到 一 个 红 JH 能 方式 数 _ 6 _6_72 
抽取 一 ТИНИ ЯНЕ АИ 6+4+5 1 25 





РОЮ) = тате 713 
= 55 1 
(РСВ) Gr4rs 153 


6.4 


6.5 


6.6 


6.7 


(d) 由 (a) 知 , P(R)=1-P(R)=1 -4 =% 


_ 抽 到 一 个 红 球 或 白 球 的 可 能 方式 数 __6+4 _10_2 
(е) РКО) ”抽取 一 个 球 的 所 有 可 能 方式 数 614441515™”3 


另 解 HCA, Р(КО W)=P(B)=1- P(B)=1- 方 = 地 


注意 , PIRUW) = Р(Е) + PIWIE = 2+4) 
下 ,一 般 的 结论 Р(Е, ЈЕ) = Р(Е,) + P(E,) 是 正确 的 . 
抛 气 一 个 均匀 的 仍 子 两 次 . 求 第 一 次 出 现 4, 5 或 6 日 第 二 次 出 现 1，2,3 或 4 的 概率 . 
解 БЕ 设 EE 为 事件 “第 一 次 出 现 4,5 或 6", E, 为 事件 “第 二 次 出 现 1，2, заа" 
落 时 的 六 种 方式 和 第 二 次 下 落 时 的 六 种 方式 结合 起 来 考虑 , 一 共有 6 x 6 = 36 种 方式 ,它们 都 是 等 可 
能 的 .Ei 发 生 的 三 种 方式 和 E, 发 生 的 四 种 方式 结合 起 来 , 一 共有 3 x 4 = 12 种 方式 使 得 EI 和 E, 同 
时 发 生 或 称 E, E, 发 生 . 则 P(EI1E,)=12/36= 1/3. 
注意 , P(E1E2)= Р(Е,)Р(Е,)| Ё1-- = 5-.Ф | 对 于 独立 事件 E, 和 Е, RY. 


从 一 副 洗 好 的 52 张 牌 中 抽取 两 张 . 求 在 第 一 张 牌 (a) 放 回 , (b) 不 放 回 , 两 种 取 牌 方式 下 
两 张 都 是 A 的 概率 . 


М S B E, 为 事件 “第 一 次 抽 到 А”, Е, 为 事件 “第 二 次 抽 到 А”. 
(a) 如 果 第 一 张 牌 放 回去 , 则 El Е, 是 独立 事件 .那么 


P( 两 张 都 是 A) = PEED = PEPE) = 5.5 = ү 
(b) 第 一 张 牌 可 在 52 张 牌 中 抽取 , 如 不 放 回 , 则 第 二 张 牌 可 在 余下 的 51 张 中 任 取 . 抽取 两 张 牌 有 52 
x51 种 等 可 能 的 方法 . 
Ei 可 以 有 4 种 方式 发 生 而 E, 和 Е, 同时 发 生 或 者 说 ЕЕ, 发 生 的 方式 有 4x3 种. 则 P(E,E,) 
4x3 1 


52х51 2217 

注意 , Р(Е;| Е)= P( 已 知 第 一 张 是 A 时 第 二 张 也 是 A) =. ЕНЩ E Е, 不 独 
立时 ,一般 的 结论 P(E, Е) = P(E) P(E Ei) 成 立 . 
从 习题 6.3 中 提 到 的 盒子 里 连续 取出 三 个 球 . 求 在 球 (a) 放 回 , (b) 不 放 回 . 两 种 取 球 方 
式 下 依次 取 到 红 球 、 白 球 和 蓝 球 的 概率 . 


# F R RR 为 事件 “第 一 次 取 到 红 球 ”, W 为 事件 “第 二 次 取 到 白 球 ”, B 为 事件 “第 三 次 取 到 蓝 
球 ”, 要 求 P(RWB). 
(а) 如 果 球 是 放 回 的 , R, W Ж В 就 是 独立 事件 . 


3 
.这 个 例子 可 以 说 明 对 于 互 不 相 容 事件 E 和 








P(RWB)= P(R)P(W)P(B) = irs gn cri 


6 4 5 8 


15 7 15°15 7225 
(b) 如 果 球 是 不 放 回 的 , R, W 和 B 不 是 独立 事件 . 


P(RWB) = P(R)P(W | R)P(B' WR)= Ey ҮЗҮК 
-8,4 5 4 
15 14 13 91 


其 中 P(BI WR) 是 已 知 第 一 次 取出 红 球 且 第 二 次 取出 白 球 的 条 件 下 又 取出 蓝 球 的 条 件 概 率 . 
抛 据 两 次 山子 , 求 4 至少 出 现 一 次 的 概率 . | 
МО EF R ERERKEN 4”, Е, = 事件 “第 二 次 出 现 4” 则 E1UE,= 事件 “第 一 次 或 第 二 
次 或 两 次 同时 出 现 4” = 事件“ 至 少 一 次 出 现 4” .要求 Р(Е,\)Е,). 
解法 一 仍 子 下 落 两 次 有 6x6=36 种 等 可 能 的 方式 .日 
E, 发 生 而 ,不 发 生 的 方式 数 =5 
Е. КЕЕ 不 发 生 的 方式 数 =5 


6.8 


6.9 


E 和 E, 同时 发 生 的 方式 数 =1 
则 事件 E, 或 E; 至 少 一 个 发 生 的 方式 数目 是 5+5+1=11,P(E,UE,)= A 


解法 二 HFE ME, 不 是 互 不 相 容 的 , P(EIUE))=PIEI)+P(E)) - Р(Е,Е,), Н Е, 和 下 ,是 


1 


独立 的 , P(E1E;)= Р(Е,)Р(Е,). Р(Е,\)Е») = Р(Е,)+ Р(Е,)- Р(Е,Е,) = + +4 1 


1. 
6 6 
解法 三 P(4 至 少 出 现 一 次 ) + 已 (4 一 次 也 不 出 现 )=1 


P(4 至 少 出 现 一 次 )= 1 Р(4 一 次 也 不 出 现 ) 
= 1 一 了 (第 一 次 不 出 现 4 且 第 二 次 也 不 出 现 4) 
= 1- Р(Е,Е,) =1- Р(Е,)Р(Е,) 
5 5 11 


-1-6°6-3 
一 个 袋子 里 装 有 4 个 白 球 和 2 个 黑 球 ; 另 一 个 袋子 里 装 有 3 个 白 球 和 STER. 从 每 个 
袋子 里 取出 一 个 球 , 求 下 列 事件 发 生 的 概率 ;(a) 两 个 球 都 是 白 球 , (b) 两 个 球 都 是 黑 


球 , (c) 一 个 日 球 一 个 黑 球 . 
E EF RW 为 事件 “从 第 一 个 袋子 里 取出 的 是 白 球 ”", W, 为 事件 “从 第 二 个 袋子 里 取出 的 是 白 


бу 4 3 
(а) РОЮ, М) = Р(М)Р(Ж) = 5° 


(b) Р(Ў,%,) = РО, POW) = = ў 
(с) 事件 “一 个 白 球 一 个 黑 球 "相当 于 “第 一 个 为 白 球 第 二 个 为 黑 球 ,或 第 一 个 为 黑 球 第 二 个 为 白 球 ”， 
ИП wW WUW W НЕ WW, 和 W WwW 是 互 不 相 容 的 , 则 有 
P(WiW2 U Р) = P(W,W,) + P(W, W3) 
| = P(W,)P(W:) + P(W,)P( W,) 
4 5 2 3 1 


4+2 3+5 4+2 3+5" 24 


另 解 〈c) 要 求 的 概率 为 1 - P(WiW2) РО, 9) =1- 1-5. 19. 

A 和 B 共 下 了 12ER, нА Гой, BATAR. То wF 
К.Н 12 盘 棋 的 结果 为 经 验 概率 , 求 后 3 盘 棋 中 下 列 事 件 发 生 的 概率 . (a)A ЇЗ 
盘 ,(b) 和 了 2 盘 ，(c) A 和 B 轮流 获胜 ,(d) B ЖЛ 1%. 

Ж EF 设 4i， Аз 和 А; 分 别 表示 А 赢 了 第 一 盘 , 第 二 盘 和 第 三 盘 棋 ;Bl, В, 和 В, 分 别 表示 В Ж 


了 第 一 盘 、 第 二 盘 、 第 三 盘 棋 ;D1, D 和 р, 则 分 别 表 示 和 了 第 一 盘 , 第 二 盘 和 第 二 盘 棋 . 


根据 他 们 以 往 的 战况 (经 验 概率 ), 我 们 认为 P(A ЖЕЕ) =É- L, РВ ВИЕ) = 4 














(a) РСА ЖТЗ) =P(A142A3)= P(A1)P(A2)P(A3)= 福 " 方 " 让 = 二 
这 里 假定 每 盘 棋 的 胜 负 结果 是 互相 独立 的 ,这 是 合理 的 (除非 选手 们 在 心理 上 受到 了 其 他 胜 负 结 果 的 
影响 ). 
(b) P( 和 了 2 盘 )= Р(1,2 盘 和 或 1,3 盘 和 或 2,3 ÆA) 
= Р(р,р,рз) + P(D1D,D;3) + Р(Р,р,р,) 
= P(DI)P(D2)P(D3)+ P(DI)P(D,)P(D;)+ P(D1)P(D,)P(D,;) 
_1,1 5,1 5 1 5 1 1 15 5 


66 6 6 6 6 6 6 6 21672 
(c)P(A 和 B 轮流 获胜 ) = P( 三 盘 棋 结果 依次 为 A ЕВ HEA ЖЕН В HEA HEB ЖЕ) 
= P(A B2A3U В,А,В;) = P(A, B2A3) + P(BIA,B;,) 
= Р(А,)Р(В,)Р(Аз) + P(BI)P(A,)P(B,) 


_1 1 1 . 
2273702 3 
(РОВ ЖА) =1- Р(В 一 盘 也 没 赢 ) 
=1- P(B1B,B;3)=1- P(B,)P(B,)P(B;) 


bb | 一 


L 
ө 
„е 
„у 

| 


概率 分 布 
жн Ч, 假定 每 个 小 孩 是 男 是 女 是 等 可 能 的 , 求 有 不 同 个 数 男 孩 和 女孩 


解 和 设 B 为 事件 “小 孩 为 男 ”, G 为 事件 “小 孩 为 女 ”. 则 根据 等 可 能 的 假设 , Р(В) = Р(С) = 


6.10 


六 .在 有 三 个 孩子 的 家 庭 中 , 下 列 互 不 相 容 事件 以 其 相应 的 概率 发 生 ， 


(а) 二 个 都 是 男孩 {BBB )， 
Р(ВВВ) = Р(В)Р(В)Р(В) = + 


这 里 我 们 假定 前 一 个 男孩 的 出 生 决 不 会 影响 到 下 一 个 男孩 的 出 生 , 即 各 事件 是 独立 的 - 
(b) 三 个 都 是 女孩 (GGG): 和 (a) 相 对 称 
P(GGG) = + 


(с) 两 个 男孩 一 个 女孩 (BBG U BGB U GBB): 
P( BBG U BGB U GBB)= P(BBG) + P(BGB) + P(GBB) 
= P(B)P(B)P(G)+ P(B)P(G)P(B) 


+ Р(С)Р(В)Р(В) 
1 1,1 3 


8 вве в 
(d) 两 个 女孩 一 个 男孩 (GGB U GBG U BGG): 和 (相对 称 ,概率 为 也， 
如 果 我 们 以 随机 变量 X 表示 三 个 孩子 中 男孩 的 人 数 , 则 其 概率 分 布 如 表 6.2 所 示 ， 


表 6.2 








6.11 ” 作 图 表示 习题 6.10 中 的 分 布 . 


Р(Х) Р(Х) 


3/8 
2/8 


1/8 


X 





解 eSF 图 6-3 或 6-4 均 可 表示 习题 6.10 中 的 分 布 , 注 意 ,图 6-4 中 几 个 矩形 的 面积 之 和 为 1, 这 
样 的 图 称 为 概率 直方 图 .虽然 和 是 离散 的 ,我 们 也 把 它 当 作 连 续 型 变量 来 考虑 , 而 且 这 种 方法 常常 
是 非常 有 效 的 .如 果 不 想 把 变量 当 作 连续 的 ,就 要 用 类 似 于 6-3 这样 的 图 . 


6.12 ”一 连续 型 随机 变量 只 在 0 和 4 间 取 值 , ЖЖ ОН Р(Х) = > _ aX,a 是 常数 . 


(a) 计算 a; 
(b) ЖР(1<Х<2). 
# 097 (a) 如 图 6-5, p(X)= 二 -aX 的 图 像 是 一 条 直线 .为 求 得 a, 我们 要 认识 到 该 直线 的 下 方 


和 X 轴 上 方 介 于 直线 X=0 和 X=4 之 间 的 区 域 面 积 为 1. 当 X=0 时 p(X)= 方 , 当 X=4 时 


РОХ) = 42 .然后 选择 a 使 得 梯形 的 面积 为 1. 榜 形 面积 - 十 x 高 x 两 底 之 和 = 二 x4x 


btt- ha =2(1-4a)=1, HE 1- 4a =F, 4а = 1, W а= 


所 以 正确 的 图 形 应 是 图 6-6. 
(b) 如 图 6-6 所 示 , 要求 的 概率 就 是 X=1 和 X=2 之 间 的 面积 由 (a), p(X)= > — 1 Хх, (1) 








= (2) = 十 分 别 是 对 应 于 X=1 和 X=2 的 纵 坐 标 .要 求 的 概率 即 是 三 角形 的 面积 :二 xlx 


二 


Р(Х) Р(Х) 





数学 期 望 


6.13 


一 个 人 购买 抽签 售 物 的 彩票 , 中 一 等 奖 得 5000 美元 和 中 二 等 奖 得 2000 美元 的 概率 分 
刘 是 0.001 和 0.003. 则 一 张 彩票 的 合理 价格 是 多 少 ? 

解 EF 他 的 期 望 为 5000 美元 x0.001 + 2000 美元 x0.003=5 美元 +6 美元 = 11 美元 , 这 是 个 合 
理 的 价格 . 

在 一 宗 贸 易 投 机 中 ,一 位 女士 获 利 300 美元 的 概率 是 0.6, 亏本 100 美元 的 概率 是 0 4 
解 БЕ 她 的 期 望 为 300 RI Xx0.6+( -100 美元 ) х0.4= 180 美元 - 40 美元 = 140 美元 . 

Жж 6.3 表示 的 概率 分 布 的 (a) Е(Х),(Ъ)Е(Х°),(с)Е[(Х-Е(х))?]. 











6.16 


排列 


6.17 


1 1 3 
解 F (а) E(X) = Xp(X) = 8х +12 х + 16 х 8 


1 1 


t 20 х +24х 175 = 16 
这 表示 分 布 的 均值 . 
2、_ 2 оз, Д 2,1 
(b) E(X?) = >,Х?р(Х) = х е +I 
2, З. 0, 1. 20d 
+ 16° x -g +20 хр +24 x ja = 276 


这 表示 二 阶 原点 矩 . 
(c) 


1 


Е[(Х-Е(Х))?]= У\(Х -– Е(Х))? p(X) = (8- 16)? x о 


+ (12-16) х + (16-16) х Š 


теу 1 аим Д 
+ (20 16)? х -z + (24 16) х 75 = 20 


这 表示 分 布 的 方差 . 
一 个 袋子 中 有 2 个 日 球 和 3 个 黑 球 . A，B, CAHD 依次 从 袋子 中 取出 一 个 球 且 不 放 
回 . 第 一 个 取 到 日 球 的 人 将 得 到 10 美元 奖金 . 求 4A，B，C 和 的 期 望 . 
E S 因为 袋子 中 只 有 3 个 黑 球 ,要 想 获 胜 必须 第 一 次 就 取 到 白 球 .分 别 用 A,，B, C 和 D 表示 
事件 “A 获胜 ”,“B 获胜 ”,“C 获胜 "和 “DD 获胜 ”. | 

2 2 


P(A ЖЖ) = Р(А) = 25 = 2 





А] А 的 期 望 = E x10 美元 = 4 美元 ， 
P(A 失败 B 获胜 ) = P(AB) = Р(А)Р(В1\А) = =. 2 2 3. 


则 B 的 期 望 =3 美元 . 
P(A, B 失败 C Ж) = Р(АВС) = P(A)P(B | А)Р(С\ АВ) 


-3,2,2 
5 


_ 1 
4 3 5 
则 С 的 期 望 =2 美元 . 
P(A,B 和 C 失败 D 获胜 )= P(ABCD) 
= Р(А)Р(В | A)P(C | AB)P(D | АВС) 


2,4,1 _ 1 


= 二， „4,41 
则 D 的 期 望 =1L 美元 . 


从 验 :4 美元 + 3 美元 +2 美元 +1 美 元 = 10 美元 Н+ 2..2 1. 


5 个 不 同 颜色 的 球 排 成 一 行 , 共有 多 少 种 排列 方法 ? 

М ЕЕ 我 们 把 5 个 球 安 排 在 5 个 位 置 上 ;一 一 一 一 一 .第 一 个 位 置 上 可 以 安排 5 个 弹 球 中 的 任 
何 一 个 ( 即 安排 第 一 个 位 置 有 5 种 方法 ). 当 第 一 个 位 置 排 定 后 ,安排 第 二 个 位 置 有 4 种 方法 .安排 第 
三 个 位 置 有 3 种 方法 ,第 四 个 位 置 有 2 种 方法 .安排 最 后 一 个 位 置 时 只 剩 下 1 种 方法 .所 以 

5 个 球 排 成 一 行 的 排列 数 =5x4x3x2x1=51 =120 
一 般 地 ， 
п 个 不 同 物体 排 成 一 行 的 排列 数 = п(п-1) (9 -2).1=n! 
这 也 称 为 从 ”个 不 同 物体 中 一 次 取出 ”个 的 排列 数 ， 记 作 ,P，. 
一 张 长 使 上 有 4 个 空位 ,安排 10 个 人 坐 .共有 多 少 种 方法 ? 
解 ”& 安排 第 一 个 位 子 可 有 10 种 方法 ， 第 一 个 位 子 定 下 后 安排 第 二 个 位 子 可 有 9 种 方法 , 安排 


6.20 


6.21 


6.22 


6.23 


第 三 个 .第 四 个 位 子 各 有 8 种 ,7 种 方法 .所 以 
10 人 坐 4 个 位 子 的 排列 数 =10x9x8x7=5040 
一 般 地 ， 
п 个 不 同 物体 中 取出 > 个 的 排列 数 = п (п 1): (а +1) 
这 也 称 为 从 яп 个 不 同 物体 中 一 次 取出 + 个 的 排列 数 , 记 作 ,P,，P(n,7) 或 Po, AEE r= nh} 
„Pa = n!, 如 习题 6.17. 
计算 (a)sP3,(b) 6Ра, (с) 1sPi, (d) 3P3. 
E EF (a) Р; = 8х7 х6 = 336 (Ь);Р =6х5х4х3 = 360 
(с) 15Р = 15 (4): Рз =3х2х1=6 
5 位 男士 和 4 位 女士 坐 成 一 排 , 女士 必须 坐 在 偶数 位 上 .共有 多 少 种 可 能 的 排 法 ? 
Ж Кє 男士 共有 ;Ps 种 坐 法 ,女士 共有 4P4 种 坐 法 ;将 男士 和 女士 的 坐 法 结合 起 来 , 则 要 求 的 排 法 
数 是 :PP4,=514! =120x24=2880. 
用 10 个 数字 0，1，2，3, …,9 能 组 成 多 少 个 分 别 满足 下 列 要 求 的 四 位 数 ? 
(а) 可 以 有 重复 数字 , (b) 无 重复 数字 , (с) 个 位 必须 是 0 且 无 重复 数字 . 
解 E (а) 首位 数字 可 以 是 9 个 数字 中 的 任 一 个 (0 不 可 以 在 首位 ) .第 二 三 .四 位 可 以 是 10 个 数 
字 中 的 任 一 个 . 则 可 组 成 9x 10 x 10 x 10 = 9000 个 数 . 
(b) 首位 数字 可 以 是 9 个 数字 中 的 任 一 个 ( 除 0 外 ). 第 二 位 数字 可 以 是 其 余 9 个 数字 中 的 任 一 人 ( 首 
位 上 的 数字 不 可 再 用 ). 第 三 位 数字 可 以 是 8 个 数字 中 的 任 一 个 (前 两 位 上 的 数字 不 可 再 用 ) 个 位 数 
字 可 以 是 7 个 数字 中 的 任 一 个 (前 三 位 上 的 数字 不 可 再 用 ). 则 可 组 成 9x9x8x7=4536 个 数 、 
习 解 ”首位 数字 可 以 是 9 个 数字 中 的 任 一 个 ,余下 的 三 位 数字 共有 。P, 种 选 法 , 则 可 组 成 9.9P3=9 
х9х8х7= 4536 TH. 
(с) 首位 数字 有 9 种 选择 ,第 二 位 数字 有 8 种 选择 , 第 三 位 数字 有 7 种 选择 . 则 可 组 成 9x 8x7= 504 
个 数 . 
DE ”首位 数字 有 9 种 选择 , 中 间 两 位 数字 有 sP, 种 选择 . 则 可 组 成 9%Р›;=9х8х7= 504 1%. 
PRERE 4 本 不 同 的 数学 书 ,6 本 不 同 的 物理 书 和 2 本 不 同 的 化 学 书 . 分 别 有 多 少 种 
满足 下 列 要 求 的 排放 方法 ? (a) 每 门 学 科 的 书 必须 放 在 一 起 , (Ь) 只 有 数学 书 要 放 在 一 
起 . 


E 097 (а) 数学 书 自身 可 有 4P4= 4! 种 排 法 , 物理 书 有 ,P。= 6! 种 排 法 ,化 学 书 有 :P; = 2! 种 排 
法 ,二 种 书 有 3P3= 31 种 排 法 . 则 要 求 的 排列 数 =4! 6! 21 3! = 207 360. 

(b) 将 4 本 数学 书 看 作 一 本 大 书 ,那么 我 们 共有 9 本 书 , 有 ,P。= 9! 种 排 法 . 在 每 一 种 排 法 中 数学 书 
都 是 放 在 一 起 的 .但 数学 书 自 身 还 有 sPs= 4! 种 排 法 . 则 要 求 的 排列 数 =91 41 = 8 709 120). 
五 个 红色 球 , 两 个 白色 球 和 三 个 蓝 色 球 排 成 一 行 . 如 采 同 种 颜色 的 球 不 可 区 分 ,共有 多 
少 种 可 能 的 排 法? 

解 КЕБ 假设 有 PP 种 不 同 的 排 法 .P 乘 以 (a) 5 个 红 球 自身 的 排列 数 ,再 乘 以 (b) 2 个 白 球 自身 的 
排列 数 及 (c) 3 个 蓝 球 自身 的 排列 数 ( 即 P 3201512131), 就 得 到 当 10 个 球 可 以 区 分 时 的 排列 数 ( 即 
101). TI 


10! 
51213! 
一 般 地 ,如果 п МИТНА п, п, 5, m 个 是 一 样 的 , 不同 的 排列 数 为 
n! 
пу! na! een! 


5!2!3! x P = 10!, P= 





其 中 пу+по + + др. 

7 个 人 围 着 一 张 圆桌 坐 下 , АГРЕ FIERE? (a) 可 任意 坐 , (b) 有 2 
个 人 不 能 坐 在 一 起 . 

解 E (а) 让 其 中 1 个 人 随意 坐 下 , 则 其 余 6 人 有 6! =720 种 举 法 .这 就 是 7 个 人 围 成 一 圈 的 总 
的 排列 数 . 


6.28 


(b 将 指定 的 2 个 人 看 作 1 个 人 , 则 一 共有 6 个 人 ,有 5S! 种 坐 法 .但 是 这 2 个 人 自身 有 21! 种 坐 法 ,所 
以 安排 7 个 人 围 -圆桌 坐 下 , 其 中 有 2 个 指定 的 人 坐 在 :起 的 方法 有 5S! 2! =240 种 . 
由 (a),7 个 人 围 … 圆 昌 坐 下 但 有 2 个 人 不 能 坐 在 一 起 的 排列 方法 =720- 240= 480 种 . 


10 个 物体 分 成 两 组 , 每 组 分 别 包含 4 个 和 6 个 物体 .共有 多 少 种 分 法 ? 
解 E 这 和 分 别 有 4 个 和 6 个 是 相同 的 10 个 物体 的 排列 数 是 一 样 的 .由 习题 6.23, 为 
10! “10x9x8x7 
































= 210 
416! 4! 
这 个 问题 相当 于 求 从 10 个 物体 中 选 出 4 个 的 方法 数 (或 10 个 中 选 出 6 个 ) ,而 选择 的 顺序 并 不 
一 般 地 ,从 n 个 物体 中 不 考虑 顺序 地 选 出 > 个 的 选择 方法 数 称 为 ”中 取 ， 的 组 合 数 , 记 为 
| 
nj ___п! __ _ п(п-1)з(я—-у»+1) aP 
„| (п-к) r! or! 
ШЙ ?| $ | 
ў , (b , 
Т (а), 0. СЛИ 
1| _ 7! 7x6x5x4 7x6x5 
ш ОИЕ и а  ©73х2х1 35 
6 6! _6х5х4х3х2 6\ [6 
| | -2 或 ЕНЕ 


4 
(с) | 让 是 4 个 物体 全 部 选 出 的 近 择 数 ,而 这 种 选 树 是 惟一 的 , 则 | | =1. 注 意 ,者 我 们 定义 0! =1, 
则 从 形式 上 有 

4) 4! 

И = 01 = ! 


处 9 人 中 选 出 一 个 由 5 人 组 成 的 委员 会 ,共有 多 少 种 选 法 ? 


解 EF 
9 9! 9 х8х7хбх 5 
И = 5417 5! = 126 


从 5 位 数学 家 和 7 位 物理 学 家 中 选 出 一 个 由 2 位 数学 家 和 3 位 物理 学 家 组 成 的 委员 
会 .者 (a) 任 何 数学 家 和 物理 学 家 都 可 入 选 ， (b) 一 位 指定 的 物理 学 家 必须 入 选 , (c) 两 
位 指定 的 数学 家 不 能 入 选 ,各 有 和 多少 种 选 法 ? 
Ш кє (a) 5 位 数学 家 中 选 出 2 位 共有 | > 种 方法 ,7 位 物理 学 家 中 选 出 3 位 共有 | ” 种 方法 ,一 
共 可 能 有 的 选 法 数 为 | 

5 7 

| |.| | = 10х35 = 350 

2 3 


Й 


А | 
| 种 方法 ,6 位 物理 学 家 中 选 出 另外 的 2 位 共有 | ‘| 种 方法 ,一 共 


(b) 5 位 数学 家 中 选 出 2 位 共有 | ) 


可 能 有 的 选 法 数 为 


5 6 
| = 10x15 = 150 
2 2 


заш лу рт x 3 ， 
(с) З 位 数学 家 中 选 出 2 位 共有 | ;| 种 方法 ,7 位 物理 学 家 中 选 出 3 位 共 有 | "| 种 方法 , 一 共 可 能 有 
的 选 法 数 为 


7) = 3x35 = 10s 


6.29 ТЕН 5 文 不 同 品种 的 花 , 她 可 以 扎 成 多 少 种 不 同 的 花束 ? 
E E 每 支 花 会 有 2 种 处 理 方式 : 选 或 不 选 . 将 一 支 花 的 2 种 处 理 方式 和 其 他 花 的 2 种 处 理 方式 


结合 起 来 ,5 支 花 的 处 理 方式 共有 2 种 .但 2 种 包括 一 支 花 都 没 选中 的 情形 .因此 要 求 的 花束 数目 
=2 -1=31. 
另 解 ”她 可 以 从 5 支 花 中 选 出 1 支 ,2 支 ,……5 支 扎 成 花束 . 则 要 求 的 花束 数目 为 


FERCH 
1 2 3 4 
一 般 地 , 对 于 任意 的 正 数 n | 
ЕШ; 


6.30 从 7 个 辅音 字母 和 5 个 元 音字 母 中 选 出 4 个 辅音 字母 和 3 个 元 音字 母 组 成 单词 , 可 组 


成 多 少 单词 ?单词 不 一 定 要 有 意义 . 
5 
# Кю 4 个 不 同 的 辅音 字母 有 | 种 选 法 , 3 个 不 同 的 元 音字 母 可 有 | | 种 选 法 , 选 出 的 7 个 不 


同 的 字母 (4 个 辅音 字母 和 3 个 元 音字 母 ) 自 身 有 7P; = 7! 种 排列 方法 . 则 组 成 的 单词 数 为 


十 











5 
S| = 5410+10+5+1=31 


н 
+ ta |= 2-1 


H 

















7 5 
ИЙИ = 35 x 10 x 5040 = 1 764 000 


n! 的 Stirling ЙТ 


6.31 计算 50!. 
# EF ж, 很 大 时 ,我 们 有 n! ~œ //2хплп"е ”, W 


50! ~ V2r + 50. 5029720 = S 
为 求 S ,两 边 以 10 为 底 取 对 数 , 则 


1 


1085 = log( vV 1007 . 5050650) = 六 log100 1 


Jogr + 5010850 – 501оре 


= 六 log100 十 


1 


2 log3. 142 + 50log50 ~ 50log2.718 


- 4 х2 + 1 x 0.4972 + 50 x 1.6990 — 50 x 0.4343 = 64.4846 


由 此 得 $=3.05x105,S 有 65 位 . 
概率 和 组 合 分 析 


6.32 ”盆子 里 装 有 8 个 红 球 ,3 个 白 球 和 9 个 蓝 球 ,从 中 随机 抽取 3 个 球 . 求 下列 事 件 发 生 的 
ЖОЖ: (а) 3 个 都 是 红 球 , (Ъ) 3 个 都 是 白 球 , (с) 2 个 红 球 1 个 白 球 ， (d) 至 少 有 1 个 白 
Ж, (е) 每 种 颜色 1 个 , (Р) 顺 次 为 红 , 白 , RER. 


E EF (a) 解 法 一 КІ, Ra, Rs 分 别 表 示 事 件 “ 第 一 次 .第 二 次 、 第 三 次 取 到 的 是 红 球 ” 则 
К.К.К: 表示 取 到 的 3 个 球 都 是 红 球 . 


P(RIR2R3) = P(R1)P(R3 | RI)P(R; | КҮКЕ.) = эг . 5 . £ _ 14 


解法 二 
Н 
кш _ 8 ТЕТИРИ 3 个 的 方法 数 (3 14 
所 求 概率 -20 个 球 中 取 3 不 的 方法 数 = 20у = 285 
3 
(Ь) 同 (a) 的 解法 二 


P(3 个 都 是 白 球 ) = -> -L 


亦 可 用 (a) 中 解法 一 的 方法 . 
(c) 


№) 3 1 个 的 方法 
P(2 个 红 球 1 个 白 球 )= 48 ЕЕ | 





17 
Ji | ‚|, Е EA _ 34 _23 
(4) Р(1 азан = fao =p H P( 至 少 有 1 个 日 球 )=1- 55 = 55 


3 
FINIH 
(e) PERESID Ta се 
3 
(0 由 (e), P( 顺 次 为 红 、 白 、 蓝 球 ) = 让 PP( 每 种 颜色 1 个 )= 1.18 3 
DPE R W, 表示 事件 第 一 次 取 到 的 是 白 球 ， ‚ В; 表示 "第 三 次 取 到 的 是 蓝 球 ” 则 
P(RIW2B;)= Р(Е,)Р(%/, | RI)P(B; | Ri W3) 


8 3 9 3 


20 19 18 95 

6.33 ”从 一 副 洗 好 的 52 张 牌 中 抽出 5 张 , 求 抽 到 下 列 牌 的 概率 ， 
(a) 4 张 A (b)4 张 A,1 张 KK 
(c) 3 张 10,2 张 J (d) 9,10,J, Q,K 各 1 张 
(e) 其 中 有 3 张 是 同一 花色 的 , 男 2 张 是 另 一 花色 的 ” ({) 至 少 有 1 张 A 


ИИ 
Ж Е (лї) Р(4%А) = td 1 


ИН 


| 52] T 649 740 














(b) P(4 5% A, 1 ЖК) = 








5 
МІЙ 
(с) Р(3 К 10,23 J) = Еи 一 ТЕГҮ 
и 
ШИИ 

(4) Р(9,10,], О,К#1 юар ТТГ 

5 
(е) 选 定 第 一 种 花色 时 有 4 种 选择 , 选 第 二 种 花色 时 有 3 种 选择 , 则 

| з | | З) 
P(3 张 同一 花色 , 另 2 张 为 另 -花色 ) = ер = е 
| 


8 


———— 


(0) РЫ ЖА 也 没有 ) = | P( 至 少 有 1 张 A)=1- 35-673 _ 18 482 


54145 54 145 





“| 


48 
Ls] as 
52 
р“ 
6.34 ҮЙРӨН 5 К, RE 3 KEA 6 的 概率 . 
М r 用 5 个 空格 - - - — — 表示 5 次 抛掷 的 结果 .每 一 个 空格 里 或 者 是 6 或 者 不 是 6(6), 


6.35 


6.36 


例如 ,3 个 是 6，2 个 不 是 6, 可 能 为 66 66 6 或 666 66 等 . 
66 66 6 发 生 的 概率 为 


P(66 666) = Р(6)Р(6)Р(&)Р(6)Р(6)= +. -+ 


(ж! |! 


类 似 地 , Р(6 5656) = | 2) | 二 | ,所 有 的 3 个 是 6,2 个 不 是 6 的 事件 发 生 的 概率 都 一 样 .这 样 的 


2.1.35 
6 6 


事件 共有 | -| = 10 个 , 且 这 些 事件 是 也 不 相 容 的 , 则 所 求 概率 为 
666 86668 а 519 _ 125 
Pp(66565 或 65656 等 等 ) = |5). (二 | (2) = 3888 
一 般 地 , 如果 p= P(E), а= P(E), N 次 独立 试验 中 己 发 生 X 次 的 概率 为 | pxgN Х 


某 家 工厂 一 台 机 器 生产 的 螺栓 中 有 20% 是 次 品 , 从 这 台 机 器 某 天 的 产品 中 随机 选 出 
10 个 螺栓 , 求 抽 到 下 列 产品 的 概率 :(a) 2 个 次 品 , (b)2 个 或 2 个 以 上 次 品 , (с) 5 个 以 
上 次 品 . 


解 ESF (a) 同 习题 6.34 


N 
X 





10 
P(2 个 次 品 ) = | > Jo.2 0.85 = 45 x 0.04 x 0.1678 = 0.3020 


(b) 
P(2 个 或 2 个 以 上 次 品 )= 1 - P( 无 次 品 ) - P(1 个 次 品 ) 


10 10 
= 1- | 7 |б.2°-о.в®- | MOLELE, 


= 1-0.8 -10x0.2x0.8° 
= 1 0.1074 – 0.2684 = 0.6242 
(с) 
Р(5 个 以 上 次 品 ) = P(6 个 次 品 ) + Р(7 个 次 品 ) + Р(8 个 次 品 ) 
+ P(9 个 次 品 ) + Р(10 个 次 品 ) 








10 10 
[0.27-0.85 + 1.27 -0.8 
7 8 








10) 10 
+ 0.29. 0.8! + 1.2" 
9) 10 


= 0.00637 
从 习题 6.35 提 到 的 产品 中 选取 1000 组 样品 ,每 组 有 10 个 螺栓 ， 我 们 预期 从 中 能 找 出 
多 少 组 满足 下 列 条 件 的 样品 ? (а) 2 个 次 品 ;(b) 2 个 或 2 个 以 上 次 品 ; (с)5 个 以 上 次 
TE 
解 EF (a) 由 6.35(a) 得 ,期 望 值 = 1000x0.3020=302 


(b) 由 6.35(b) 得 , 期望值 = 1000 x 0.6242~624. 
(с) 由 6.35(c) 得 ,期 望 信 = 1000 x 0.00637==6. 


样本 空间 和 欧 拉 图 


6.37 


(а) 建立 表示 抛 搓 一 对 均匀 盘子 一 次 的 结果 的 样本 空间 

(b) 由 样本 空间 求 抛 撕 一 对 均匀 骨 子 一 次 所 得 点 数 和 为 7 或 11 的 概率 . 

E OE (а) 样本 空间 由 图 6-7 中 的 点 集 构成 .每 个 点 的 第 一 个 坐标 是 其 中 -个 般 子 上 的 数字 ,第 
ЕЕ ТЕР ЕМЕСЕ. 一 共有 36 个 点 ,每 个 点 对 应 的 概率 都 为 蕊 .样本 空间 中 所 有 点 对 


应 的 概率 和 是 1. 
(b) 图 中 A ЖП В 所 指 的 点 集 分 别 表示 事件 “和 为 7” 与 “和 为 11”. 


P(A)= A 中 所 有 点 的 概率 和 = 


5 |е 


P(B) = B 中 所 有 点 的 慨 率 各 = = 


P(A U B)= А PAB 中 所 有 点 的 概率 和 = sti - 8. 2. 


注意 ,本 题 中 Р(АЏ В) = Р(А) + P(B) XERA A 和 B 没有 公共 点 ( 即 它 们 是 互 不 相 容 事件 ). 













(2.6) (3, 6) (4, 6) 


(3,5) (4,5) 





(4,4) 


图 6-7 


6.38 用 样本 空间 理论 证 明 . 
(а) P(AUB)= Р(А) + Р(В) – P(AB) 
(b) P(AUBUC)= Р(А) + Р(В) + Р(С) - Р(АВ) ~ Р(ВС) – Р(АС) + Р(АВС) 
证 明 GF (а) 如 图 6-8, RE A 和 B 的 公共 部 分 非 空 ,用 АВ 表示 . A 由 АВ 和 АВ 组 成 ,而 В 由 
BA 和 АВ 组 成 .AUB 中 所 有 点 = A 中 所 有 点 +B 中 所 有 点 - AB 中 所 有 点 .因为 一 个 事件 或 集合 
的 概率 就 是 集合 中 所 有 点 所 对 应 的 概率 之 和 , 所 以 有 
P(A U В) = Р(А) + P(B) – P(AB) 
AIE НА-АВ 表示 属于 A 但 不 属于 B 的 点 组 成 的 集合 ( 即 АВ), W А- АВ ЖИВ 是 互 不 相 容 的 
( 即 它 们 无 公共 点 ), 而且 P(A-AB)=P(A)-P(AB). 则 
P(A U B)- P(A- АВ) + Р(В) – P(A) – Р(АВ) + P(B) 
= P(A) + P(B) ~ P(AB) 
(b) 如 图 6-9,A, В, С 为 三 个 点 集 . 记 号 ABC 表示 属于 A Ж В 但 不 属于 C 的 点 组 成 的 集合 , 其 他 
记号 的 含义 同 理 可 得 . 
ЖА, В, C 中 的 点 分 成 如 图 6-9 所 示 的 7 个 互 不 相 容 的 集合 .所 求 的 概率 为 
P(A U BU С) = P(ABC) + Р(ВСА) + Р(САВ) 





图 6-8 





图 6-9 
+ Р(АВС) + P(BCA) + P(CAB) + Р(АВС) 
为 得 到 ABC ,我们 在 A 中 除去 A В Ж АЯС 的 公共 点 ,但 是 这 样 一 来 A,B 和 C 的 公共 点 
就 去 掉 了 两 次 .因此 ABC = А – AB - AC + АВС H. 
Р(АВС) = P(A) – P(AB) – P(AC) + Р(АВС) 


同 理 可 得 
Р(ВСА) = P(B) ~ Р(ВС) – P(BA) + Р(ВСА) 
Р(СА В) = P(C) – Р(СА) – Р(СВ) + Р(САВ) 
Р(ВСА) = Р(ВС) – Р(АВС) | 
Р(САВ) = Р(СА) - Р(ВСА) 
Р(АВС) = Р(АВ) – Р(САВ) 
Р(АВС) = Р(АВС) 
将 7 个 方程 相 加 并 注意 到 Р(АВ) = P(BA ) 等 ,我 们 得 到 
Р(АШЫВ\(\)С)= Р(А) + Р(В) + Р(С) – P(AB) 
– Р(ВС) – P(AC) + Р(АВС) 
调查 500 名 学 生 某 学 期 选修 代数 物理 和 统计 学 的 情况 ,数据 如 下 : 
代数 ”329 代数 和 物理 ”83 
物理 186 代数 和 统计 217 
统计 295 物理 和 统计 63 


求 满 足下 列 条 件 的 学 生 数 ， 
(а) 选 了 所 有 课 (pb) 选 了 代数 未 选 统计 
(с) 选 了 物理 未 选 代数 (d) 选 了 统计 未 选 物理 


(е) 选 了 代数 或 统计 但 未 选 物理 (f) 选 了 代数 但 未 选 物理 或 统计 

М S 用 A 表示 所 有 选修 代数 的 学 生 的 集合 , (A) 表 示 这 个 集合 的 人 数 .类 似 地 ,用 (B) 表 示 选 修 
物理 的 人 数 , 用 (C) 表 示 选 修 统计 的 人 数 . 则 (4AUBUC) 表 示 选 修 代数 或 物理 或 统计 或 几 者 兼 有 的 
人 数 , (AB) 表 示 既 选 代 数 又 选 物理 的 人 数 等 . 同 习题 6.38, 有 

(АШ В\) С) = (А) + (В) + (С) – (АВ) – (ВС) – (АС) + (АВС) 
(а) 将 数据 代入 上 式 , 有 
500 = 329 + 186 + 295 – 83 – 63 – 217 + (АВС) 

得 (ABC) = 53, 这 是 三 门 课 都 选 的 人 数 .注意 , ЗЕЕ ГОА НОСЕВ) ЕЖ E. 

(b) 求解 问题 的 一 个 简便 方法 是 用 欧 拉 图 来 表示 属于 各 个 集合 的 人 数 . 由 于 有 53 人 选修 了 三 门 课 ， 
我 们 可 推出 选修 代数 和 统计 但 未 选 物理 的 人 数 是 217 - 53 = 164, 如 图 6-10. 图 中 其 他 数目 也 可 由 已 
知 数据 求 得 . 

由 已 有 数据 , 可 得 选修 代数 未 选 统计 的 人 数 = 329 - 217= 112; 或 由 图 6-10 得 82 + 30=112. 

(с) 选 物理 未 选 代 数 的 人 数 =93 +10 = 103. 
(d) 选 统 计 未 选 物理 的 人 数 =68+164=232. 
(е) 选 代数 或 统计 但 未 选 物理 的 人 数 =82 + 164 + 68= 314. 
(f) 选 代 数 但 未 选 统 计 或 物理 的 人 数 = 82. 





图 6-10 


外 到 习题 


概率 的 基本 法 则 


6.40 


6.41 


6.48 


6.49 


6.51 


求 下 列 事件 发 生 的 概率 p 或 其 估计; 

(а) 从 一 副 洗 好 的 牌 中 抽取 一 张 , 抽 到 天 ，A， 梅花 了 或 方块 Q. 

(b) 抛掷 一 对 均匀 和 货 子 一 次 , 点 数 和 为 8. 

(с) 600 个 螺栓 中 有 12 个 是 次 品 , 从 中 取出 1 个 是 正品 . 

(d) 抛 抠 一 对 均匀 狼 子 一 次 ,点 数 和 为 7 或 11. 

(е) WRB SENER, 至 少 出 现 一 次 正面 . 

从 一 副 洗 好 的 牌 中 连续 地 抽 三 张 牌 .EE 为 事件 “第 一 张 是 K", Е, 为 事件 “第 二 张 是 K"*, E, 为 事件 
“第 三 张 是 K” .叙述 下 列 记号 的 含义 ， 

(а) Р(Е,Е,) (с) Е, ЈЕ, (е) Е,Е,Е; 

(b) P(E U E2) (d) Р(Е,|Е,Е,) (f) Р(Е,Е,ЈЕ,Е,) 

从 一 个 装 有 10 个 红 球 ,30 个 白 球 ,20 个 蓝 球 和 15 个 黄 球 的 盒子 里 随机 抽取 一 个 球 . 求 抽 到 下 列 球 的 
概率 ;(a) 黄 球 或 红 球 , (b) 不 是 红 球 或 蓝 球 , (с) 不 是 蓝 球 , (d) HER, (e) 红 球 , 白 球 或 蓝 球 . 

МУ 6.42 中 的 盒子 里 连续 取 两 个 球 , 抽取 是 有 放 回 的 . 求 抽 到 下 列 球 的 概率 : (а) 两 个 白 球 , (b) 第 
一 个 是 红 球 , 第 二 个 是 白 球 , (с) 两 个 都 不 是 黄 球 , (а) 两 个 球 或 者 是 红 球 或 者 是 白 球 , (е) 第 二 个 不 是 
ESR, (р 第 一 个 是 黄 球 , (g) 至 少 有 一 个 是 蓝 球 , (h) 至 多 有 一 个 是 红 球 , (1) 第 一 个 是 白 球 但 第 二 个 
不 是 , (j) 只 有 一 个 是 红 球 . 

如 果 抽 取 是 不 放 回 的 ,求解 习题 6.43. 

ЕЈ ЕК, Ка) 一 次 , (b) 至 少 一 次 ,(c) 两 次 得 到 点 数 和 为 7 的 概率 . 

从 一 副 洗 好 的 52 张 牌 中 连续 抽取 2 张 , 求 下 列 事件 发 生 的 概率 :(a) 第 一 张 不 是 梅花 10 也 不 是 А, 
(b) 第 一 张 是 A 但 第 二 张 不 是 , (с) 至 少 有 一 张 方块 , (d) 两 张 不 是 同 花 的 ,(e) 至 多 有 一 张 花 牌 (J， 
Q, К), (有 第 二 张 不 是 花 牌 , (g) 第 一 张 是 花 牌 但 第 二 张 不 是 , (h) 两 张 是 花 牌 或 黑 桃 或 两 者 都 有 . 
盒子 里 装 有 标 有 1 至 9 的 9 张 票 ,从 中 一 次 取出 3 З. 求 它 们 依次 是 (1) 奇 数 ,偶数 ,奇数 ,(2) 偶数 , 奇 
数 , 偶数 的 概率 . 

AMB FIR, A 对 B 的 胜 败 比 是 3:2. 若 A 和 B 下 三 盘 棋 ,下 列 事件 发 生 的 胜 败 比 是 多 少 ? (а) А Ж 
"Б ЖК ЮЛ, (b) 前 两 盘 BAA. 

一 个 钱包 里 有 2 枚 银币 和 4 枚 铜币 , 另 一 个 钱包 里 有 4 枚 银币 和 3 枚 铜币 . 从 两 个 钱包 中 的 一 个 里 任 
取 一 枚 硬币 ,取出 的 是 银币 的 概率 是 多 少 ? 


一 位 男士 将 再 活 25 年 的 概率 是 -3 ,他 的 妻子 将 再 活 25 年 的 概率 是 之 . 求 下 列 事件 发 生 的 概率 ; (а) 


两 人 都 能 再 活 25 年 , (b) 只 有 男士 可 再 活 25 ЖЕ, (с) 只 有 他 的 妻子 可 再 活 25 年 ， (4) 至 少 有 1 人 可 再 
活 25 Е. 

ЖН 800 个 家 庭 , 每 家 有 4 个 孩子 .假定 每 个 孩子 是 男 是 女 是 等 可 能 的 ， 预计 下 列 事件 发 生 的 百分比 
会 是 多 少 ? (a) 有 2 个 男孩 2 个 女孩 , (b) 至 少 有 1 个 男孩 ,(c) 没有 女孩 ， (d) 至 多 有 2 个 女孩 . 


概率 分 布 


6.52 如果 随机 变量 X 表示 一 个 有 4 个 孩子 的 家 庭 里 男孩 的 个 数 (见习 题 6.51), (а) 列表 表示 X KER 


布 , (b) 画图 表示 X 的 概率 分 布 . 

6.53 ”连续 型 随机 变量 X 只 在 2 和 8 之 内 取 值 , 它 的 密度 函数 为 a( 针 +3), 其 中 a 是 常数 . (а) 计算 a, (b) 
3K P(3<X<5), (с) ЖОР(Х:>4),(4) Ж P(IX-5|<0.5). 

6.54 ”从 一 个 装 有 4 个 红 球 和 6 个 白 球 的 镀 子 里 无 放 回 地 取出 3 个 球 .随机 变量 X 表示 取 到 的 红 球 的 个 数 . 
(а) 列表 表示 Х 的 概率 分 布 ,(b) 画 图 表示 X 的 概率 分 布 . 

6.55 求 习题 6.54 中 的 (a) Р(Х=2), (Ь) P(1 志 XX 二 3), 并 解释 结果 . 


数学 期 户 


6.56 某 人 参加 游戏 ,可 以 0.2 的 概率 得 到 25 美元 , 可 以 0.4 的 概率 得 到 10 美元 . 求 参加 游戏 的 合理 价格 是 
多 少 ? 

6.57 卖命 人 下 雨天 每 天 可 挣 30 美元 , 晴天 每 天 亏本 6 美元 . 如果 出 现 雨 天 的 概率 为 0.3, 那 他 收入 的 期 望 
值 是 多 少 ? 

6.58 A 和 比赛 抛 搓 硬币 .他 们 轮流 抛掷 一 枚 均匀 硬币 3 次 , 先 使 得 硬币 正面 向 上 的 人 获胜 .如 果 A 先 抛 
且 赌 注 是 20 美元 ,那么 每 人 应 出 多 少 钱 比赛 才 是 公平 的 ? 

6.59 KRR 6.4 中 的 概率 分 布 的 (a) ECX), (b) Е(Х?), (с) Е[(Х- Е(Х))2], (4) Е(Х?). 


表 6.4 


X -10 — 20 30 
p(X) 1/5 3/10 1/2 


6.60 参考 习题 6.54, 求 X 分 布 的 (a) 均 值 , (b) 方 差 ,(c) 标 准 差 ,并 解释 结果 . 
6.61 假设 随机 变量 X 以 概率 p 取 值 1, 以 概率 g=1-p БИНО. ПЕН. 
(а) E(X)= р, (b) Е[(Х-Е(Х))?]= рд. 
6.62 ПЕНЯ, (а) E(2X+3)=2E(X)+3,(b) Е[(Х-Е(Х))?]=Е(Х?)-[Е(хХ)]?. 
6.63 XX 和 YY 是 两 个 具有 相同 分 布 的 随机 变量 ,证 明 :E(X+Y)=E(X)+ Е(Ү). 


6.64 计算 ;(a) P2, (b) P5, (с) Р». 

6.65 求 n, 使 得 , ,1P;= ,Ps 成 立 . 

6.66 沙发 上 只 有 3 个 位 子 , 有 5 个 人 想 坐 ,共有 多 少 种 安排 方法 ? 

6.67 7 本 书 放 在 书架 上 ,有 多 少 种 排列 方法 ?如果 (а) 任何 排列 都 可 以 , (b) 某 3 本 书 必 须 放 在 一 起 , (с) 
某 2 本 书 必须 放 在 两 端 . 

6.68 ”数字 1，2，3,…，9 可 组 成 多 少 个 没有 重复 数字 的 五 位 数 ? 如 果 (a) 组 成 的 五 位 数 为 奇数 , (b) 每 个 数 
的 前 两 位 是 偶数 . 

6.69 ”如果 数字 可 以 重复 ,求解 习题 6.68. 

6.70 3 个 4,4 个 2 和 2 个 3 可 组 成 多 少 个 不 同 的 三 位 数 ? 

6.71 3 位 男士 和 3 位 女士 围 着 圆桌 坐 下 , 有 多 少 种 坐 法 ? 如 果 (a) 没有 任何 限制 , (b) 某 2 位 女士 不 能 坐 在 
一 起 , (с) 每 位 女士 都 要 坐 在 两 位 男士 中 间 . 


єз о [ 7) o) o) 
3 4 8 
n+l n 

6.73 R n, {+183 , | =7 ”| 成立 


6.74 ”10 个 问题 中 选 出 6 个 ,有 和 多少 种 选 法 ? 

6.75 从 8 位 男士 和 6 位 女士 中 能 选 出 多 少 个 由 3 位 男士 和 4 位 女士 组 成 的 不 同 的 委员 会 ? 

6.76 从 6 位 男士 ,8 位 女士 ,4 个 男孩 和 5 个 女孩 中 选 出 2 位 男士 ,4 位 女士 ,3 个 男孩 和 3 个 女孩 ,有 多 少 种 
方法 ?如 果 (а) 没有 任何 限制 , (b) 某 一 位 男士 和 某 一 位 女士 必须 入 选 . 

6.77 将 10 个 人 分 组 有 多 少 种 分 法 ” 如果 (a) 分 为 两 组 , 一 组 7 人 ,一 组 3 М) 分 为 三 组 ,各 有 4 人 ,3 人 








6.80 


ЖЗЛ. 

从 5 位 统计 学 家 和 6 位 经 济 学 家 中 选 出 3 位 统计 学 家 和 2 位 经 济 学 家 组 成 一 个 委员 会 ,可 有 多 人 少 种 
方法 ? Ш (а) 没有 任何 限制 ,(b) Ж 2 位 统计 学 家 必须 入 选 , (c) 某 1 位 经 济 学 家 不 能 入 选 . 

从 单词 Tennessee 中 选取 4 个 字母 , 求 其 (a) 组 合 数 , (Ь) 排列 数 . 


al-l 
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6.81 


6.82 


杂 题 


6.90 


6.91 
6.92 
6.93 


6.94 


6.95 


100 个 物体 中 选 出 30 个 排列 ,有 多 少 种 方法 ? 
2a 
证 明 ; 当 n 很 大 时 , | |н San. , 


从 一 副 52 张 的 牌 中 抽取 3 张 . 求 抽 到 下 列 牌 的 概率 ;(a) 两 张 ) К, (b) 三 张 同 花 的 , (с) 三 张 不 
是 同 花 的 , (а) 至 少 两 个 A. 
抛掷 一 对 均匀 的 货 子 四 次 , 求 至 少 两 次 点 数 和 为 7 的 概率 . 
如 果 一 台 机 器 生产 的 钾 钉 有 10% 是 次 品 , 那么 随机 抽取 的 5 个 锦 钉 中 (a) 1 个 次 品 也 没有 , (b) 有 1 个 
К, (с) 至 少 有 2 个 次 品 的 概率 是 多 少 ? 
(а) 建立 样本 空间 表示 抛 撕 一 枚 均匀 硬币 两 次 的 结果 .用 1 表示 “正面 ", 用 0 表示 “反面 ” 
(b) 由 样本 空间 求 至 少 一 次 出 现 正面 的 概率 . 
(с) 能 否 建 立 一 样本 空间 表示 抛掷 一 枚 硬币 三 次 的 结果 ? 若 能 ,用 它 求 至 多 两 次 出 现 正面 的 概率 . 
FEZA, В 和 CC) 竞选 三 个 职位 ,下 面 是 对 200 位 选民 的 民意 测验 的 结果 ， 

28 人 文 持 A 和 B 122 人 支持 В 或 C, 但 不 支持 A 

98 人 支持 4 或 B, 但 不 支持 С 64 人 支持 C, 但 不 支持 4 或 B 

42 人 支持 B, 但 不 支持 АС 14 人 支持 4 和 C, 但 不 支持 В 
则 满足 下 列 条 件 的 有 多 少 人 ? (а) 支持 所 有 竞选 者 , (b) 支持 A, 不 支持 B 或 C, (с) 支持 B, 不 支持 A 
或 C, (4) 支持 C, 不 支持 A В, (е) 支持 A 和 B, 不 支持 C, (人 只 支持 其 中 一 人 . 
(а) 证 明 ; 对 任意 事件 El 和 E,, P(E UE,)SP(E) + P(E,). 
(Ъ) 将 (a) 的 结果 推广 . 
E, E, 和 E, 是 三 个 互 不 相 容 的 事件 上 且 P(E;) >0, P(EIU EU E;)=1.A 为 任 一 概率 大 于 0 的 事 
件 ,如 果 Р(Е,), Р(Е,), Р(Е,)Я] Р(А|Е,), Р(А|Е,), P(AiE3) 已 知 ,证 明 : 

Р(Е,)Р(А | Е,) 

P(EDP(A | E1) + Р(Е;)Р(А | E2) + Р(Ез)Р(А | Е,) 
以 及 关于 P(E,1A) 和 P(E,|A) 的 类 似 结果 .这 就 是 贝 叶 斯 法 则 或 贝 叶 斯 定理 它 在 计算 事件 A 发 生 
RIFF E, E 或 Е, 发 生 的 条 件 概率 时 是 非常 有 用 的 .这 个 结果 可 加 以 推广 . 
有 三 个 不 同 的 珠宝 盒 , 每 个 盒子 有 两 个 抽 层 .第 一 个 盒子 的 每 个 抽 层 里 各 有 -- 块 金 表 .第 二 个 盒子 的 
每 个 抽 尾 里 各 有 一 块 银 表 . 第 三 个 盒子 的 一 个 抽 屠 里 有 一 块 金 表 ， 为 一 个 抽 展 里 有 一 块 银 表 .如果 我 
们 随机 挑选 一 个 盒子 ,打开 其 中 的 一 个 抽 懂 , 发 现 里 面 有 一 块 银 表 , 则 另 一 抽 居 里 是 金 表 的 概率 为 多 
少 ? (提示: 利用 习题 6.89 的 结论 ) 
求 从 数字 1, 2,3, …, 40 中 选中 6 个 无 顺序 的 中 奖 数字 的 概率 
求解 习题 6.91, 如 果 假 设 只 要 选中 (a) 5 个 数字 ,(b) 4 个 数字 , (с) 3 个 数字 . 
玩 扑 克 时 , 从 一 副 52 张 的 牌 中 给 每 人 发 五 张 . 求 菜 人 拿 到 下 列 牌 的 胜 败 比 ， 
(а) 同 花 大 顺 ( 同 种 花色 的 А, К, О, J 和 10); 
(b) 同花顺 ( 同 种 花色 的 五 张 连 续 的 牌 ,如 黑 桃 3，4，5，6 和 7)， 
(с) 四 张 一 样 的 (如 四 张 7); 
(d) 三 张 一 样 , 另 两 张 也 一 样 ( 如 三 张 К 和 两 张 10). 
A 和 B 约定 在 下 午 3 点 和 4 点 之 间 见 面 ,并 说 明 每 人 等 对 方 的 时 间 不 超过 10 分 钟 . 求 他 们 能 遇见 的 
概率 . 
在 长 为 a >0 的 线段 上 任 取 两 点 . 求 形成 的 三 条 线段 能 构成 三 角形 的 概率 ， 


P(E, 1А) = 


第 七 章 ”二 项 分 布 , 正 态 分 布 和 泊 松 分 布 


二 项 分 布 

在 任 一 次 试验 中 , 某 事 件 发 生 的 概率 ( 称 为 成 功 的 概率 ) 为 p, 不 发 生 的 概率 ( 称 为 失败 的 
ВЕЖ) у q=1> p, WE 六 次 独立 试验 中 该 事件 发 生 X 次 ( 即 成 功 和 次 ,失败 N-X 次 ) 的 概 
率 为 


N) x N-x _ N! X N-X 
(Nla 7 XI(N-X)!? 4 (1) 





p(X) = 
其 中 X=0,1,2,…,N,NI =N(N-1)(N 一 2)…1,0! =1( 见 习题 6.34 中 定义 ). 
例 1 抛掷 一 枚 均匀 硬币 6 次 ,2 次 出 现 正面 的 概率 为 (将 N=6, X=2, p=g= 二 代入 
(1) 式 ) 

6—2 ,6 
НЕЕ -l -E 
B2 ”抛掷 一 枚 均匀 硬币 6 次 ,至 少 4 次 出 现 正面 的 概率 为 

6—4 | – 6-6 

(二) 


了 6 1 11 
= 64764 + 64 32 


离散 型 概率 分 布 (1) 常 被 称 为 二 项 分 布 ,因为 当 X=0,1,2,…,N 时 , 它 逐 项 对 应 于 二 项 式 公 
































(9+ р)^ = д + др + М М2 2 +... + р^ (2) 
N N 
PREI кр 1,|” | 、 | … 称 为 一 项 式 系数 
例 3 
4 4 4 
(а + р =at PPHPP aja +p 


= g + 4gp + 6g? p? + дар + р“ 
分 布 (1) 是 James Bernoulli 在 17 世纪 未 发 现 的 , KLIAR АБ. 们 努 利 分 布 的 一 些 性 质 
列 在 表 7.1 中 . 


表 7.1 二 项 分 布 、 
均值 и= Np 
方差 с? = Npg 
标准 差 в = VNpo 
矩 偏 度 系数 mA 
矩 峰 度 系数 а{=3+ 1820 


例 4 MRBS 100 次 ,正面 出 现 次 数 的 均值 是 = Np = 100x 十 = 50, 这 就 是 


抛掷 一 枚 均匀 硬币 100 次 ,正面 出 现 次 数 的 期 望 值 .标准 差 是 


с = /{Мрч = [100х-у x5 = 5. 





正 态 分 布 
连续 型 概率 分 布 的 最 重要 的 例子 之 一 就 是 正 态 分 布 ,也 称 为 高 斯 分 布 . 它 由 概率 密度 
— 1 T =y) (3) 
2 Ља ” 


定义 .其 中 j= 均值 ,o = 标准 差 , л =3.14159…, e = 2.71828…. 曲线 (3) 和 X 轴 所 围 的 总 面 
积 是 1, 因此 ,曲线 下 方 在 X=a 和 X=b 之 间 的 面积 表示 久 落 在 a 和 4 之 间 的 概率 , 记 为 
Р(а<Х<ь), Еф а<ь. 


将 变量 X 标准 化 为 = 28, (3) 式 就 变 为 所 谓 的 标准 形式 

1 _ -12 

уз ч) 
此 时 我 们 称 Z 服从 均值 为 0 方差 为 1 的 标准 正 态 分 布 .图 7-1 是 标准 正 态 曲 线 的 图 像 . 图像 
表明 在 Z= -1 和 2Z=+1 之 间 ,Z=-2 和 2Z=+2 之 间 ,Z= -3 和 Z= +3 之 间 的 面积 分 别 
为 总 面积 的 68.27%,95.45% 和 99.73% ,总 面积 是 1. 附 录 开 中 的 表 给 出 了 曲线 在 Z=0 和 7 


= 任意 正 数 之 间 的 面积 .利用 曲线 关于 7 = 0 的 对 称 性 , 曲线 在 任意 两 平行 于 y 轴 的 直线 之 间 
的 面积 都 可 由 表 得 到 . 





Ү = 





———6827% ——= 
_——————9545% — —— 





99,73% 一 一 一 


图 7-1 


(3) 式 给 出 的 正 态 分 布 的 一 些 性 质 列 在 表 7.2 中 . 


表 7.2 正 态 分 布 
均值 и 
方差 | с? 
标准 差 | с 
рири аз = 0 
ГҮҮ a4=3 


| 平均 偏差 в V2/x = 0.79792 


二 项 分 布 和 正 态 分 布 的 关系 


ШЖ NEKE p 和 4 与 0 都 不 是 很 接近 , 二 项 分 布 的 标准 化 变量 


_X-Np 
v Npq 


就 近似 于 标准 正 态 分 布 .由 表 7.1 和 7.2 可 见 , 当 N 越 大 时 , 近似 效果 就 越 好 , 在 极限 情形 下 
结论 是 精确 的 . 当 N 越 大 时 , 二 项 分 布 的 偏 度 和 峰 度 就 越 接 近 于 正 态 分 布 的 .在 实际 情形 中 ， 
若 Np 和 Ng 都 远 远 大 于 5, 近似 效果 是 非常 好 的 . 
间 松 分 布 

离散 型 概率 分 布 





Х -A 
p(X) = Ае 
是 Siméon-Denis Poisson ФЕ 19 世纪 前 叶 发 现 的 ， 所 以 被 称 为 泊 松 分 布 ,其 中 e =2.71828 人 
是 一 个 给 定 的 常数 . 训 (X) 的 值 可 由 附录 出 中 的 表 ( 给 出 了 不 同 的 ， 对 应 的 e “ 值 ) 或 对 数 法 求 
H. 

泊 松 分 布 的 一 些 性 质 列 在 表 7.3 P. 


X 三 0,1,2,… (5) 


表 7.3 泊 松 分 布 


均值 “= 
方差 o = А 
标准 差 go = 
TEES з= ил 
和 矩 峰 度 系 数 a4=3+1/) 


二 项 分 布 和 泊 松 分 布 的 关系 


在 二 项 分 布 (1) 中 , 如 果 N 很 大 而 事件 发 生 的 概率 p 接近 于 0, 即 q=1- p 接近 于 1, 则 
称 事件 为 稀有 事件 . 在 实际 情形 中 , 当 试验 的 次 数 不 少 于 500 №2250), M Мр 小 于 5 时 ,我 们 就 
认为 它 是 稀有 事件 .比较 表 7.1 和 表 7.3 可 知 此 时 , 二 项 分 布 非常 近似 于 А = Np 的 泊 松 分 布 
(5) .这 是 因为 将 1 = №, д1 和 рл) 代入 表 7.1, 就 可 得 到 表 7.3. 

既然 二 项 分 布 和 正 态 分 布 之 间 存 在 某 种 关系 ， 那么 泊 松 分 布 和 正 态 分 布 之 间 也 应 该 有 基 
种 关系 .事实 上 , 当 4 趋向 于 正 无 穷 大 时 , 泊 松 分 布 的 标准 化 变量 ( 义 和 )/V4 就 近似 于 标准 正 


多 项 分 布 


如 果 互 不 相 容 的 事件 Ei, E,,*…, Е, 分 别 以 概率 pj， ЁР2,`°°°, рь EEH p, 十 pit’ + р, = 
1, 则 在 N 次 独立 试验 中 事件 Ei, E2, Е, ЛЖ Х,, Xa, Х, 次 的 概率 为 
N! 
ХЫР РР (6) 
其 中 XI + Х, +++ Х, = М, 这 一 分 布 是 二 项 分 布 的 推广 ， 而 表达 式 (6) 是 多 项 展开 式 
(Pit Pp2 二 … 二 pi) 的 一 般 项 ,所 以 被 称 为 多 项 分 布 . 
15 ШУТ 12 0,1581 1,2,3,4,5 ЖП 6 各 两 次 的 概率 为 





12! ура рар [1 人 | — —1925_ _ 0.00344 
ті L 2.) (+ H L) 6 559 872 
N 次 试验 中 五 )， Е», ” Е, 发 生 次 数 的 期 望 值 分 别 是 Мр,, Мр», е, Np. 


用 样本 的 频率 分 布 拟 合 理论 分 布 


如 果 可 以 通过 概率 推理 或 其 他 方法 得 到 关于 总 体 分 布 的 一 些 信息 ,就 有 可 能 用 总 体 的 样 
本 频率 分 布 来 拟 合 总 体 的 理论 分 布 (也 称 为 模型 分 布 或 期 望 分 布 ). 常 用 的 一 般 方法 包括 利用 
样本 的 均值 和 标准 差 来 佑 计 总 体 的 均值 和 标准 差 ( 见 习题 7.31,7.33 和 7.34). 

我 们 常用 x“( 希 腊 字 母 ) 检 验 ( 见 第 12 章 ) 来 检验 理论 分 布 的 拟 合 优 度 . 判断 正 态 分 布 是 
否 是 已 知 数据 的 一 个 好 的 拟 合 , 简便 方法 是 用 正 态 曲线 图 纸 , 有 时 也 叫 概率 图 纸 ( 见 习题 














7.32). 
习题 及 解答 
二 项 分 布 
7.1 WA TIME: 
! 8 7 4 4 
(a) 5! (ет Со), б (е) | о 
解 ШЕР (а) 5! =5х4х3х2х1= 120 
6! __6х5х4х3х2х1] _6х5_ 
0 ад (2x1) х(ахзх2х1) 2x1 
S| = -8XIx6xX5X4xX3xX2X1 -8XIX6_ 56 
(c) 3) 3! (8—3)! 3! 5! (3x2xl)x(Sx4x3x2xl) 3х2х1 
4 7|- 7! _ TX6x5x4x3x2x1 _7х6_„, 
(d) 5s) 5! 2! (5 x4x3x2x1)x(2x1) 2x1 
、 4 4! 
(e) 由 定义 0! = = 
4 o al 
ПИЕ: 4! 


7.2 ”假设 在 人 群 中 有 15% 的 人 是 左 撤 子 , 求 在 50 个 人 中 下 列 事件 发 生 的 概率 ,(a) 至 多 有 
10 ERF, (b) 至 少 有 5 ЕЩЕ, (с) 有 3 到 6 个 左 撤 子 , (4) 正好 有 5 个 左 撤 子 . 
要 求 用 Minitab 求解 . 


Я Е (а) Minitab 的 输出 结果 如 下 所 示 . 输 入 命令 cdf 10; 二 项 分 布 的 子 命令 n= 50 和 p=.15, 即 
可 得 到 要 求 的 概率 .50 人 中 至 多 有 10 个 左 撤 子 的 概率 是 0.8801. 
МТВ > cdf 10; 
SUBC > binomial n = 50 p= .15. 
Cumulative Distribution Function 
Binomial with n = 50 and p =0.150000 
x Р(Х<=хх) 
10.0 0.8801 
(b) Minitab 的 输出 结果 如 下 所 示 . 至少 有 5 个 左 扳 子 的 逆 事 件 是 至 多 有 4 个 左 撤 子 .由 P( 事 件 ) = 1 
-了 P( 逆 事件 ), 有 P(X>5)=1 -P(X<4)=1 -0.1121 = 0.8879. 
MTB > cdf 4; 
SUBC > binomial n = 50 p=.15. 
Cumulative Distribution Function 
Binomial with n = 50 and p = 0.150000 
х Р(Х < х) 
4.00 0.1121 


(с) Minitab 的 输出 结果 如 下 所 示 .P(3 委 X 委 6)= Р(Х<6) - Р(Х<2) = 0.3613 – 0.0142 = 0.3471. 
MTB > cdf 6; 

SUBC > binomial n =50 p=.15. 

Cumulative Distribution Function 

Binomial with n = 50 апа р = 0. 150000 


x Р(Х < х) 
6.00 0.3613 
МТВ > cdf 2; 


SUBC > binomial n = 50 р = .15. 
Cumulative Distribution Function 


Binomial with n = 50 and р = 0. 150000 


х Р(Х<х) 
2.00 0.0142 
(d) Minitab 的 输出 结果 如 下 所 示 . 由 结果 可 见 P(X=5) = 0.1072. 
MTB > pdf 5; 


SUBC > binomial п = 50 р = .15. 
Probability Density Function 
Binomial with п = 50 and р =0.150000 
х Р(Х=х) 
5.00 0.1072 
MR — HRF 5 К, 3 Н (а) 0 次 ,(b)1 次 ,(c) 2 次 ,(d) 3 次 ,(e) 4 次 的 概率 . 


R E И 1 次 ,3 出 现 的 概率 = p= o TEAR q1- pF, 





-(a) рз шй оК) = | > (4) (0 аха (二) -35 

orean- |) 

© раз и) = |202) (5) 0x4 08-608 

W PG3 册 现 3 次 )=| | (E 2] оха 25-05 

(e) PG3 由 现 4 次 )=| (205) 51266 7777$ 
5 5 1 1 


(зня зв) | | (1) 5) sxx 
5} 6 6) “7776 7776 
注意 , 这 些 概率 是 下 面 的 二 项 展开 式 的 一 般 项 ; 


Ea А СЕТА 
АУЕ СА a 


号 出 (a) (9+ р)“, (Ь) (g + р) 的 二 项 展开 式 . 















































解 ES (a) 
4 4 4 
(q+p) = д + q?p + , 92р? + А ар? + р“ 
= qf + 44р + 6q? p? + 4gp? + р 
(Ь) 
6 6 6 
(а+р)%= а + | g5p + gtp? + азр + 24 4 5 ,6 
1 Р g) TP 419? 5) P Р 


= 4° + 64?р + 1544р? + 2043р? + 1542р“ + бар® + ps 
系数 1,4,6,4,1 和 1,6,15,20,15,6,1 分 别 被 称 为 对 应 于 N=4 和 N=6 的 二 项 式 系数 .将 N= 


0,，1，2，3,… 时 的 系数 写成 如 下 所 示 的 阵列 ,我 们 就 得 到 所 请 的 帕斯卡 三 角 . 注意 ,每 一 行 的 第 一 个 
数 和 最 后 一 个 数 都 是 1, 而 其 他 的 数 则 是 它 前 一 行 的 左边 和 右边 的 数 之 和 . 


1 1 
1 2 1 
1 3 3 1 
1 4 6 4 1 
1 5 10 10 5 1 
1 6 15 20 15 6 1 


在 一 个 有 4 个 孩子 的 家 庭 里 ,假定 男孩 出 生 的 概率 是 十 , 求 下 列 事件 发 生 的 概率 (a) 至 
少 有 1 个 男孩 ,(b) 至 少 有 1 个 男孩 和 1 个 女孩 . 


ж æ oratsi) (a i рало -( (202 
reram al [т 4. rars (ti 


则 P( 至 少 有 1 个 男孩 )= P(1 个 男孩 ) + P(2 个 男孩 ) + P(3 个 男孩 ) + P(4 个 男孩 ) 
1 3 1 1 15 


= 一 十 站 一 十 一 


4 8 4 16 16 
另 解 ”P( 至 少 有 1 个 男孩 )=1-~ P( 没 有 男孩 )=1-| 十] =1-1 15 


2 16 16 
(b) PEDA 1 个 男孩 和 1 个 女孩 ) =1- P( 没 有 男孩 ) - P( 没 有 女孩 ) 
1 1 7 


16 16 8 
在 有 4 个 孩子 的 2000 个 家 庭 中 ， 项 计 共 有 多 人 少 个 家 庭 :(a) 至 少 有 1 个 男孩 , (b) 有 2 
个 男孩 , (c) 有 1 个 或 2 个 女孩 , (d) 没有 女孩 . 可 参考 习题 7.5(a). 


解 E (а) 预计 有 1 个 男孩 的 家 庭 数 = 2000x 15 ~ 1875 


(b) 预计 有 2 个 男孩 的 家 庭 数 = 2000- РСЕ 2 个 男孩 )= 2000x 2 = 750 


(с) P( 有 1 个 或 2 个 女孩 ) = P( 有 1 个 女孩 )+ P( 有 :1 个 女孩 ) 
= P( 有 1 个 男孩 )+ P( 有 2 个 男孩 ) 


1.35 
478% 
预计 有 1 个 或 2 个 女孩 的 家 庭 数 = 2000 х 二 = 1250 


(4) 预计 没有 女孩 的 家 庭 数 = 2000x 1. = 125 

如 果 一 台 机 器 生产 的 螺栓 中 有 20% 是 次 品 ， 从 中 随机 抽取 4 个 , 求 下 列 事件 发 生 的 概 
Ж:(а) 有 1 个 次 品 ,(b) 没有 次 品 , (с) 至 多 有 2 个 次 品 4 

E кє 一 个 螺栓 是 次 品 的 概率 为 p=0.2, 个 是 次 品 的 概率 为 v=1- p=0.8. 


4 
(а) P(4 个 中 有 1 个 次 品 )= И 0.2!+0.8% = 0.4096 
4 
(b)P( 没 有 次 品 ) = | М 0.20-0.84= 0.4096 


(OPO 2 а) = (40.22.0. #2 0.1536 
则 
P( 人 至 多 有 2 个 次 品 ) = P( 没 有 次 品 ) + PU 个 次 品 ) + P(2 个 次 品 
= 0.4096 + 0.4096 + 0.1536 = 0.9728 
己 知 一 名 学 生 能 毕业 的 概率 是 0.4. 求 在 5 名 学 生 中 下 列 事件 发 生 的 概率 ; (а) 无 人 能 
毕业 , (b) 1 人 能 毕业 , (с) 至 少 1 人 能 毕业 , (а) 都 能 毕业 ， 


5 
Ж ке (a) P( 无 人 能 毕业 )= | 0.49.0.65=0.07776, 大 约 为 0.08 


(b) P(1 人 能 毕业 ) = | ， о. 4! -0.6 = 0.2592, 大约 为 0.26 
(с) 已 (至 少 1 人 能 毕业 ) =1- P( 无 人 能 毕业 ) = 0.92224, 大 约 为 0.92 
(d) P( 都 能 毕业 ) = И 0.4°:0.6° = 0.01024, 大约 为 0.01 
7.9 Ш 6 次 , 求 得 到 点 数 和 为 9(a) 两 次 , (b) 至 少 两 次 的 概率 是 多 少 ? 
E E 第 一 个 角子 的 6 种 下 落 方式 可 和 第 二 个 山子 的 6 种 下 落 方式 结合 起 来 考 虚 , 则 一 对 山子 的 


下 落 方式 一 共有 6x6=36 种 .它们 分 别 是 :第 一 个 仍 子 出 现 1, S -ARTEEN 1; 第 一 个 仍 子 出 现 
1, PARTEA 2 等 .可 分 别 记 为 (1,1),(1,2) 等 . 
在 36 种 方式 中 (如 果 第 子 是 均匀 的 , 则 它们 的 出 现 是 等 可 能 的 ), 点 数 和 为 9 的 情形 有 4 种 : (3, 


6), (4, 5), (5,4) (6,3). WHR — I RTR, 点 数 和 为 9 Ж р = 9 , 而 和 不 为 9 的 概率 
Ж д=1-р=чу. 


(а) P(2 次 出 现 9)= | | | 1.) | 3) t 40 


(b) 已 (至 少 2 次 出 现 9)= P(2 次 出 现 9) + P(3 次 出 现 9) + P(4 次 出 现 9) 
+P(S 次 出 现 9) + P(6 次 出 现 9) 
011 工 1 8 |2 
| (二) (8 
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7.10 计算 : (a) S Xp(X) 和 (b) У!Х P(X). ЖФ p(X) = x 户 9 . 
X=0 X=0 
解 F (а) 因为 g+ p=1, 所 以 有 
Da- Ухт хл? 
y N 1)! 
= Ne 2 1 TN Tp * 
= Мр(а+ р)! = Np 


М N 
У) 2 _ > 2 Tr X_N-X 


X(X -~ 1) 200 N 


N N! 
М N- 
= 211 [Х(Х ~ кшш 
М 
2 ) XIN - a 


N - 2)! 
сое $a МХ Np 


= МОМ ~ 1) 22(4 + p)? + Np 
= ММ - 1)р? + Np 


注意 , (а) 和 (b) 的 结果 分 别 是 X 和 X? 的 期 望 , 记 为 E(X) 和 E(X*)( 见 第 六 章 ). 





7.11 ”如果 一 个 变量 服从 二 项 分 布 , 求 它 的 (a) 均值 и, (b) 2728 o’. 
Ж EF (а) 由 习题 7.10(a) 
4 = 变量 的 均值 = У\Хр(Х) = Np 
X=0 
(b) Н u= Np 及 习题 7.10 的 结果 
o?= Y(X - uY p(X) = D(X? - 24X + p?) p(X) 
= УУХ?р(Х) — 2и У\хь(Х) + р? 2 p(X) 
= N(N-1)p + Np-2Np' № + (№)? -1 
= Np - Np? = Мр(1- р) = Nig 
由 此 得 二 项 分 布 的 标准 差 是 o= V Npg. 
男 解 ” 由 习题 6.62(b) 
E[(X ~- Е(Х))?]= E(X?) - [Е(Х)]? = N(N ~ 1)р2 + Np- Np? 
= Np - Np? = М№а | 
7.12 “如果 一 个 螺栓 是 次 品 的 概率 是 0.1, 求 400 个 螺栓 中 次 品 数 所 服从 的 分 布 的 (a) 均值 ， 
(ЬЕ. 
Ж Е (а) 均值 Np = 400x0.1=40, 即 我 们 可 预计 有 40 个 是 次 品 . 
(b) 方差 Npg =400x0.1x0.9=36, 则 标准 差 是 V36 = 6. 
7.13 ” 求 习 题 7.12 中 的 (a) 矩 偏 度 系数 和 (b) ERE Ж. 
| -a-p _0.9—0.1_6 133 
М к= (a) RERNE i 
因为 系数 为 正 , 所 以 分 布 向 右 偏 . 
_,,1-—6р0_„,1-6х0.1х0.9_ 
(b) RREAN =+ Npo -3+ 3 =3.01 
这 个 分 布 相对 于 正 态 分 布 来 说 略 有 点 尖峰 ( 见 第 五 章 ). 
正 态 分 布 | 
7.14 一 次 数学 测验 的 均 分 是 72, 标准 差 是 15. Ж (а) 60 分 , (b) 93 分 , (с) 72 分 的 标准 分 
Ж. 
解 кк (a) z= 人 -= _0» 
X-X B-N 
(b) = =1.4 
(с) «=Х=Х 2-2 o 
7.15 ”参见 习题 7.14, 求 对 应 于 标准 分 数 (a) -1 (b) 1.6 的 分 数 . 
解 ES (2) Х=Х-+»5=72+(-1)х15=57 
(b) Х = Х + 5 = 72+1.6х 15 = 96 
7.16 假定 一 名 棒球 运动 员 在 他 的 职业 生涯 中 参赛 的 场 数 服从 均值 为 1500, 标准 差 为 350 的 


正 态 分 布 .用 Minitab 解答 下 列 问题 :(a) 参赛 少 于 750 场 的 百分比 是 多 少 ? (b) 参赛 
多 于 2000 场 的 百分比 是 多 少 ? (с) 求 参 赛场 数 的 第 90 个 百 分 位 数 . 

解 EF (а) 由 下 面 的 Minitab 的 结果 ,可 得 Р(Х < 750) =0.0161, 或 参赛 少 于 750 场 的 占 1 .61% 
MTB >с 750; 

SUBC > normal mean = 1500 sd= 350. 

Cumulative Distribution Function 


Normal with mean = 1500. 00 and standard deviation = 350. 000 


х Р(Х <= х) 

750.0000 0.0161 
(b) 由 下 面 的 Minitab 的 结果 ,可 得 Р(Х < 2000) =0.9234. 由 此 得 Р(Х >2000)=1 ~ P(X < 2000) 
=1-0.9234=0.0766. 因 此 参赛 多 于 2000 场 的 占 7.66% . 
МТВ > cdf 2000; 
SUBC > normal mean = 1500 sd= 350. 
Cumulative Distribution Function 
Normal with mean = 1500. 00 and standard deviation = 350.000 

x Р(Х < х) 

2.00Е + 03 0.9234 
(с) Minitab 给 出 的 第 90 个 百 分 位 数 是 1.95E + 03 8 1950 9. 
МТВ > invcdf .90; 
SUBC > normal mean = 1500 sd= 350. 
Inverse Cumulative Distribution Function 
Normal with mean = 1500.00 and standard deviation = 350.000 

Р(Х = х) x 

0.9000 1.95Е + 03 
7.17 利用 附录 正 , 求 分 别 对 应 于 图 7-2 (a) 至 (g) 的 下 列 情形 下 的 正 态 曲线 下 方 的 面积 ; 

(a) 在 z=0 和 z=1.2 之 间 (е) х = – 0.6 7 
(b) Æ z= -0.68 #1 = = 0 2 [8] (DE == –- 1.28 39 
(с) Е х= 0.46 ==2.21 2] (р) = =2.05 EF, == -1.44 左 方 
(d) Е 2=0.81 #1 = =1.94 2 [8] 





解 S (а) 在 附录 IT 中 , 沿 着 标 有 > 的 一 栏 向 下 直到 找到 1.2; 再 向 右 直到 找到 标 有 0 的 一 列 . 结 
Е 0.3849, 即 为 所 要 求 的 面积 ,表示 z 在 0 和 1.2 之 间 的 概率 , 记 为 P(0 委 = 魏 1.2). 
(b) 所 要 求 的 面积 即 为 在 z=0 和 z=0.68 之 间 的 面积 (由 对 称 性 ) .为 求 此 面积 , ЖЖП, ИЖ 
标 有 z 的 一 栏 向 下 直到 找到 0.6; 再 向 右 直到 找到 标 有 8 的 一 列 . 结 果 是 0.2517, 即 为 所 要 求 的 面积 ， 
表示 z 在 -0.68 和 0 之 间 的 概率 , 记 为 P( –0.68<=%0). 
(с) ЖАЛ = (== -0.46 和 z=0 之 间 的 面积 )+ (z=0 和 =2_21 之 间 的 面积 ) 

=(z=0 和 >z=0.46 之 间 的 面积 )+(*=0 和 >z=2.21 之 间 的 面积 ) 


7.18 


7.19 


= 0.1772 + 0.4864 = 0.6626 
(а) 要 求 的 面积 =(z=0 和 >z=1.94 之 间 的 面积 )-(z=0 和 >z==0.81 之 间 的 面积 ) 
=0.4738 -0.2910=0.1828 
(e) 要 求 的 面积 =(==0 左 方 的 面积 ) — (z= -0.6 和 >=0 之 间 的 面积 ) 
=(z=0 左 方 的 面积 ) - (z=0 和 z=0.6 之 间 的 面积 ) 
=0.5—0.2258=0.2742 
(f) 要 求 的 面积 = (z= -1.28 和 z=0 之 间 的 面积 ) + (z=0 右 方 的 面积 ) 
=0.3997+0.5=0.8997 
(е) 要 求 的 面积 = 总 面积 -(*= -1.44 和 z=0 之 间 的 面积 ) 
-(z=0 和 >z=2.05 之 间 的 面积 ) 
= 1 — 0. 4251 - 0. 4798 = 1 0.9049 = 0. 0951 
分 别 求 图 7-3 中 如 下 给 定 的 面积 所 对 应 的 x 值 “ 面 积 " 指 的 是 正 态 曲线 下 方 的 面积 . 
(а) 0 和 > 之 间 的 面积 是 0.3770; 
(b) z 左 方 的 面积 是 0. 8621; 
(с) —1.5 和 х 之 间 的 面积 是 0.0217. 





解 E (a) 在 附录 中, 值 0.3770 位 于 标 有 1.1 的 行 的 右 方 和 标 有 6 的 列 的 下 方 , 则 要 求 的 z= 
1.16. 由 对 称 性 ,z = -1.16 是 另 一 解 , 则 z= +1.16. 
(b) 既 然 面积 大 于 0.5, z 必 为 正 数 .0 和 z 之 间 的 面积 =0.8621-0.5=0.3621 则 =1 09 
(QWR х HEX, 面积 应 大 于 -1.5 和 0 之 间 的 面积 0.4332 因此 z 必 为 负数 . 
情形 1 [= 为 负数 ,但 在 -1.5 的 右 方 , 见 图 7-3(c1)] 

-1.5 和 = 之 间 的 面积 =(-1.5 和 0 之 间 的 面积 ) - (0 和 > 之 间 的 面积 ) Ер 0.0217 = 0. 4332 
(0 和 zx 之 间 的 面积 ). 则 0 和 z 之 间 的 面积 =0.4332 -0.0217=0.4115 因此 -= - 1.35. 
情形 2 [z 为 负数 ,但 在 -1.5 的 左 方 , 见 图 7-3(c )] 

< 和 -1.5 之 间 的 面积 =(z 和 0 之 间 的 面积 ) -~-(-~1.$5 和 1 之 间 的 面积 ), 即 0.0217=(0 和 > 
之 间 的 面积 ) -0.4332. 则 0 和 = 之 间 的 面积 =0.0217+ 0.4332 = 0. 4549, 由 线性 插值 > = - 1.694, 
或 精确 到 z= — 1.69. 
求 正 态 曲线 在 (a) z=0.84, (b) z=-1.27, (с) z= -0.05 处 的 纵 坐 标 . 


解 E (a) ERR IH, WERE z 的 一 列 向 下 找到 值 0.8, 然后 向 右 找 到 标 有 4 的 列 . 值 0.2803 
就 是 要 求 的 纵 坐 标 . 

(b) 由 对 称 性 ;( 在 z= -1.27 处 的 纵 坐 标 ) = (在 z=1.27 处 的 纵 坐 标 ) = 0.1781. 

(с) (Œ z= -0.05 处 的 纵 坐 标 ) = (在 z=0.05 ARRIA E ER) = 0.3984. 

某 大 学 500 名 男 同学 的 平均 重量 是 151 磅 , 标准 差 是 15 88. 假设 重量 是 服从 正 态 分 布 
的 , 求 有 多 少 同学 的 重量 满足 下 列 要 求 : (а) 在 120 ÈH 155 磅 之 间 , (Ь) 大 于 185 磅 . 


Ж Е (а) 假设 记录 每 个 人 的 重量 时 都 是 四 舍 五 入 的 , 则 记录 为 120 磅 和 155 磅 之 间 的 重量 事实 


上 可 能 是 119.5 磅 到 155.5 磅 之 间 的 任何 值 ; 


119.5 的 标准 值 = 


119.5- 151 __ ,jp 


155.5 的 标准 值 = 5.2211 51 _ 0.30 


如 图 7-4(a) 
要 求 的 学 生 比 例 = (z =-2.10 和 >z = 0.30 之 间 的 面积 ) 
= (z=~2.10 和 x = 0 之 间 的 面积 ) 
+ (2 = ОЖ х = 0.30 之 间 的 面积 ) 
= 0.4821 + 0.1179 = 0.6000 
则 重量 在 120 磅 和 155 磅 之 间 的 学 生 数 = 500 x 0.6000 = 300. 
(b) 记录 重量 大 于 185 磅 的 学 生 至 少 重 185.5 磅 . 


185.5 的 标准 值 = 183.5 — 151 = 2.30 


如 图 7-4(b) 
要 求 的 学 生 比 例 = (z = 2.30 右 方 的 面积 ) 
= (z = 0 右 方 的 面积 ) - (х= 0 和 x = 2.30 之 间 的 面积 ) 
= 0.5— 0.4893 = 0.0107 
则 重量 大 于 185 磅 的 学 生 数 = 500 x0.0107 = 5. 
如 果 用 W 表示 随机 抽 到 的 一 名 学 生 的 重量 , 我 们 可 用 概率 把 上 面 的 结果 归纳 如 下 ， 
Р(119.5 < W < 155.5) = 0.6000, P(W = 185.5) = 0.0107 





Быз 2 
—2. 1 0 0). 30 - У 
(а) т 


7.21 ЖУ 7.20 +, Ж 500 名 同学 中 有 多 少 同学 的 重量 满足 下 列 要 求 :(a) 小 于 128 В, 
(b) 等 于 128 磅 ，(c) 小 于 或 等 于 128 В. 


Ж F (a) 记录 重量 小 于 128 磅 的 学 生 重 量 小 于 127.5 磅 . 


127.5 的 标准 值 = 1215—11 = 1.57 


如 图 7- 5(a) 
要 求 的 学 生 比 例 = (z = - 1.57 左 方 的 面积 ) 
= (z = 0 左 方 的 面积 ) - (= =-1.57 和 x = 0 之 间 的 面积 ) 
= 0.5 – 0.4418 = 0.0582 
则 重量 小 于 128 磅 的 学 生 数 = 500 x 0.0582 = 29. 
(b) 记录 重量 为 128 磅 的 学 生 重 量 在 127.5 磅 和 128.5 82 [8]. 


127.5 的 标准 值 = ган» =- 1.57 


128.5 的 标准 值 = ESSI L 1 


如 图 7- 5(b) 
要 求 的 学 生 比 例 = (z =- 1.57 和 x =- 1.50 之 间 的 面积 ) 
= (е =—1.57Ж z =0 之 间 的 面积 ) 
-(z=-1.$0 和 >z=0 之 间 的 面积 ) 
= 0.4418 - 0.4332 = 0.0086 
则 重量 为 128 磅 的 学 生 数 = 500 x 0.0086= 4. 


(с) 记录 重量 小 于 或 等 于 128 磅 的 学 生 重量 小 于 128.5. 
128.5 的 标准 值 = 18.51 = – 1.50 


如 图 7-5(c) 
要 求 的 学 生 比 例 = (z = - 1.50 左 方 的 面积 ) 
= (z = 10 左 方 的 面积 ) (z =-1.50 #9 z = 0 之 间 的 面积 ) 
= 0.5— 0.4332 = 0.0668 
则 重量 小 于 或 等 于 128 磅 的 学 生 数 = 500 x 0.0668 = 33. 
田 解 (利用 (a) 和 (b)) 
重量 小 于 或 等 于 128 磅 的 学 生 数 = (重量 小 于 128 磅 的 学 生 数 ) 
+ (重量 等 于 128 磅 的 学 生 数 ) =29+4= 33. 











ишү: “157 -150 BET: 
(a) (b) (c) 


图 7-5 


7.22 ”在 一 次 生物 小 测验 中 共有 10 个 问题 ,根据 学 生 回答 出 的 问题 个 数 ,得 分 分 别 为 0, 1,2， 
…, 10 分 .学 生得 分 的 平均 分 是 6.7 分 ,标准 差 是 1.2 分 .假设 分 数 是 服从 正 态 分 布 的 ， 
求 :(a) 得 6 分 的 学 生 所 占 的 百分比 , (b) 全 班 得 分 最 低 的 10% 中 最 高 的 分 数 , Сс) 全 
班 得 分 最 高 的 10% 中 最 低 的 分 数 . 





R F (a) 为 了 使 离散 型 数据 能 应 用 正 态 分 布 ， 必须 将 数据 看 成 连续 的 , 则 6 分 可 看 成 5.5 分 到 
6.5 分 . 


5.5 的 标准 值 = 5-26. = 1.0 


6.5 的 标准 值 = 926.7 = — 0.17 
如 图 7-6(a) 
要 求 的 比例 = (zx = -1 和 x =-0.17 之 间 的 面积 ) 
= (zx =~1 和 z = 0 之 间 的 面积 ) 
~-(z=-0.17 和 > = 0 之 间 的 面积 ) 
= 0.3413 - 0.0675 = 0.2738 = 27% 
(b) X, 表示 所 求 的 最 高 分 数 ， 21 表示 这 一 分 数 的 标准 值 . 由 图 7-6 (b), xl 左 方 的 面积 是 10% = 
0.10, 则 (z: 和 0 之 间 的 面积 ) = 0.40, zi = -1.28( 很 接近 ). 因 此 zı=(Xı -6.7)/1.2= -1.28, X, 
= 5.2, 或 合 入 至 最 近 的 整数 5. 
(с) Х, 表示 要 求 的 最 低 分 数 , z， 表示 这 一 分 数 的 标准 值 . 由 图 7-6 (b) 及 对 称 性 ，=， =1.28. 因 此 
(X2-6.7)/1.2=1.28, Х,=8.2,8 是 最 接近 的 整数 . 
7.23 ”一 台 机 器 生产 的 200 个 垫圈 样品 的 直径 的 均值 是 0_502 XT, 标准 差 是 0.005 英寸 
生产 所 要 求 的 直径 的 范围 是 0.496 英寸 到 0.508 关 才 ,否则 ,垫圈 就 是 次 品 BEHA 


是 服从 正 态 分 布 的 , RKA АЛЕ РА НИК ип Н 2 ШШ. 


R EF 
_ _ 0.496 - 0.502 __ 
0.496 的 标准 值 = 00 T 1.2 
_ _ 0.508 – 0.502 _ 


如 图 7-7 
正品 的 比例 = ( 正 态 曲线 下 方 在 z = -1.2 和 > = 1.2 之 间 的 面积 ) 
= (z=0 和 > = 1.2 之 间 面 积 的 两 倍 ) 
= 2 х 0.3849 = 0.7698 或 77% 
则 次 品 的 比例 为 100% -77% =23%. 
注意 , 如 果 我 们 认为 区 间 0.496 英寸 到 0.508 英寸 表示 的 实际 直 
12 0. 4955 英寸 到 0.5085 英寸 ,上 述 的 结果 就 要 稍 作 修 改 . 而 对 于 两 





图 7-7 


位 有 效 数字 ,结果 是 相同 的 . 
二 项 分 布 的 正 态 至 近 


7.24 ”抛掷 一 枚 均匀 硬币 10 次 ,分 别 用 下 列 方 法 求 出 现 正 面 3 到 6 次 的 概率 ;(a) 二 项 分 布 ， 
(b) 二 项 分 布 的 正 态 通 近 . 


Ж Е (а) 
певана эо | (Е А 
маяктаю- | 
паник (7-4 
рома |) т) (3) 08 
\P( 出 现 正面 3 到 6 次 )= 15, + 2 £ + 105 
= тор = 0.7734 


(b) ЖЕП 10 次 正面 出 现 次 数 的 概率 分 布 如 图 7.8 (a) 和 7-8 (b), 其 中 图 7-8 (b) 将 数据 看 成 连 
续 的 . 要求 的 概率 就 是 图 7-8 (b) 中 画 有 阴影 的 给 形 面积 之 和 ， 它 可 用 相应 的 正 态 曲线 下 方 的 面积 来 


近似 . 
0.3 0.3 
0.2 0.2 
概率 概率 
0.1 0.1 





0 12 3 4 5 6 7 8 9 10 зл зв з коо 
出 现 正 面 的 次 数 出 现 正面 的 次 数 
(а) (b) 


图 7-8 


车 将 数据 看 成 连续 的 , 则 出 现 正面 3 到 6 次 可 看 成 出 现 正面 2.5 次 到 6.5 次 .二 项 分 布 的 均值 和 方差 





7.25 


_ _ 2,5-5 | 
2.5 的 标准 值 = 1.58 = 1.58 


- _ 6.5-5_ 
6.5 的 标准 值 = в = 0.95 


如 图 7-9 
要 求 的 概率 = (z =- 1.58 和 > = 0.95 之 间 的 面积 ) 
= (z =- 1.58 Ж z = 0 之 则 的 面积 ) 
+ (z= ОЖ z = 0.95 之 人 的 面积 ) 
-1.58 0.95 = 0.4429 + 0.3289 = 0.7718 
这 和 (a) 中 得 到 的 真实 值 0.7734 非常 接近 . 当 N 更 大 时 ,近似 效果 会 
更 好 . 
抛掷 一 枚 均 义 硬币 500 次 . 求 正 面 出 现 的 次 数 和 250 相差 (a) 不 多 于 10, (b) 不 多 于 
30 的 概率 . 


1 _ _ 1 „1 _ 
解 EF и = № = 500 х 5 =250 о= YNpg= | 500x -5 х > =11.18 


(а) 我 们 要 求 的 是 出 现 正 面 的 次 数 在 240 和 260 之 间 的 概率 , 若 将 数据 看 作 连 续 的 , 则 是 在 239.5 和 
260.5 之 间 的 概率 .因为 239.5 的 标准 值 是 (239.5-2S0)/11.18= – 0.94, 260.5 的 标准 值 是 0.94， 
则 有 


图 7-9 


要 求 的 概率 = ( 正 态 曲 线 下 方 x =- 0.94 和 z = 0.94 之 间 的 面积 ) 
=(z=0 和 >=0.94 之 间 的 面积 的 两 倍 ) 
= 2 x 0.3264 = 0.6528 
(b) 我 们 要 求 的 是 出 现 正面 的 次 数 在 220 和 280 之 间 的 概率 , 若 将 数据 看 作 连 续 的 , 则 是 在 219.5 和 
280.5 之 间 的 概率 .因为 219.5 的 标准 值 是 (219.5 -250)/11.18= -2.73,280.5 的 标准 值 是 2 .73， 
则 有 
要 求 的 概率 = (z =0 和 >z =-2.73 之 间 的 面积 的 两 倍 ) 
= 2 x 0.4968 = 0.9936 

由 此 , 我 们 可 以 很 有 把 握 地 认为 出 现 正 面 的 次 数 不 会 和 期 望 250 相差 多 于 30. 因 此 , 如果 出 现 正 
面 次 数 超过 280, 我 们 可 以 确定 硬币 不 是 均匀 的 ( 即 有 负重 ). 
假设 在 人 群 中 有 75% 的 人 经 常 使 用 安全 带 . 随 机 截 住 100 辆 汽车 , 求 有 70 人 或 少 于 
70 人 使 用 安全 带 的 概率 .用 Minitab 对 二 项 分 布 和 正 态 分 布 的 逼近 两 种 方法 求解 . 
Ж S 如 下 的 Minitab 输出 结果 表明 有 70 人 或 少 于 70 人 使 用 安全 带 的 概率 等 于 0.1495. 
MTB > cdf 70; 
SUBC > binomial 100 .75. 
Cumulative Distribution Function 
Binomial with n= 100 and p= 0.750000 

х Р(Х < х) 

70.00 0.1495 

НЕ ОВК F: KAEA y = Np = 100 x 0.75 = 75, REZY o= 
V Npa = /100х0.75 0.25 = 4.33. Minitab 的 输出 结果 表明 近似 值 等 于 0 1493. 这 和 真实 值 非常 
接近 . 
MTB > cdf 70.5; 
SUBC > normal mean = 75 sd = 4.33. 
Cumulative Distribution Function 
Normal with mean = 75.0000 and standard deviation = 4. 33000 

x Р(Х <= х) 

70.5000 0.1493 


泊 松 分 布 


7.27 


7.28 


7.29 


一 个 工厂 生产 的 工具 中 有 10% 是 次 品 ,从 中 随机 抽取 10 个 样品 ,用 下 列 方法 求 正 好 有 
两 个 次 品 的 概率 .(a) 二 项 分 布 , (b) 二 项 分 布 的 泊 松 逼近 . 
E F 工具 是 次 品 的 概率 是 p=0.1. 


10 
(а) P(10 个 样品 中 有 2 个 次 品 )= | | ,0.0.9=0.1937 或 0.19 


(b) H à= №= 10х0.1=1 M e=2.718 


P(10 个 样品 中 有 2 个 次 品 ) e 一 е1 Д0. 1взо 80.18 

一 般 说 来 ,如 果 р<0.1 Н А = Np 志 5, 近 似 效 果 会 更 好 . 

如 采 一 个 人 注射 一 种 药剂 产生 不 良 反 应 的 概率 是 0.001, 在 2000 人 中 求 (a) 正好 有 З 
А,Ь) 多 于 2 人 产生 不 良 反应 的 概率 .用 Minitab 对 泊 松 分 布 和 二 项 分 布 两 种 方法 求 


Ж. 

Ж 8 (а) 如 下 的 Minitab 结果 先 给 出 了 正好 有 3 人 产生 不 良 反应 的 二 项 分 布 概率 .由 4 = Мр = 
2000x0.001=2, 接 着 又 给 出 了 泊 松 分 布 概率 .可 见 泊 松 逼近 和 二 项 分 布 概率 非常 接近 . 

MTB > pdf 3; 

SUBC > binomial 2000 .001. 

Probability Density Function 

Binomial with n = 2000 and p= 0. 001 


х P(X= x) 
3.0 0.1805 
MTB > pdf 3; 


SUBC > poisson 2. 
Probability Density Function 
Poisson with mu= 2 
X P(X=x) 

3.00 0.1804 
(b) EF 2 人 产生 不 良 反应 的 概率 为 1 - P(X<2). 如 下 的 Minitab 结果 说 明 用 二 项 分 布 和 泊 松 分 布 
求 出 的 X 委 2 的 概率 都 是 0.6767. 因 此 ,多 于 2 人 产生 不 良 反应 的 概率 是 1 0.6767 0.3233. 
МТВ > cdf 2; 
SUBC > binomial 2000 . 001. 
Cumulative Distribution Function 


Binomial with п = 2000 and p = 0.001 


x Р(Х < x) 
2.0 0.6767 
МТВ > cdf 2; 


SUBC > poisson 2. 
Cumulative Distribution Function 
Poisson with mu= 2 
x Р(Х <= x) 
2.00 0.6767 
一 个 泊 松 分 布 为 


0.72679 72 


p(X) = X! 


Ж (а) р(0), (b) p(1), (c) р(2), (d) p3). 
-0.72 1 e072 


0 ， 
М F(a) 由 附录 而 р(0) = 0-е Г =e "= 0.4868 





1 -0.72 
(b) (1) -012 e L 0,72-e %7 =0.72x 0.4868 = 0.3505 


0.722e ° 0.$184.e V? Е 
(с) р(2)= б = Е 20.2592 х 0.4868 = 0.1262 


ЭШ (2) = 9-22 601) =0.36х0.3505=0.1262 


3 -0.72 
(d) р(3) = HEE О (2) =0.24 x 0.1262 = 0.0303 


多 项 分 布 


7.30 


一 个 盒子 里 有 5 个 红 球 ,4 个 白 球 和 3 个 蓝 球 .从 盒子 里 随机 取出 一 个 球 并 记 下 它 的 颜 
E, 然后 再 放 回 盒子 . 按 这 种 方法 从 中 取出 6 个 球 , 求 其 中 有 3 个 红 球 ,2 个 白 球 和 1 个 
监 球 的 概率 . 


解 те P( 任 一 次 取出 的 是 红 球 ) = 芒 ,P( 任 一 次 取出 的 是 白 球 ) = E, 
P( 任 一 次 取出 的 是 蓝 球 ) = 5. 


P(3 个 红 球 ,2 个 白 球 和 1 个 蓝 球 ) = ССЗ ЗИ _ 625 


用 数据 拟 合 理论 分 布 


7.31 


拟 合 一 个 二 项 分 布 使 之 适合 习题 2.17 中 的 数据 . 
解 S 我 们 已 知 P( 抛 搓 5 个 硬币 1 次 有 YX 个 出 现 正面 )~ рох) = [> pxg”*, 其 中 p 和 分 


别 表 示 擅 撕 一 个 硬币 一 次 正面 和 反面 出 现 的 概率 .由 习题 7.11 (а), 出 现 正面 的 平均 数 是 и = № = 
5р. РЗ И (ЭЛЧ) ЭБС Л, 出 现 正 面 的 平均 数 是 


УХ 38x0+144x1+342x2+287x3+164x4+25x5 2470 
Уу 1000 ~ 1000 





= 2.47 
使 理论 上 的 均值 和 实际 中 的 均值 相等 , 5p = 2.47, 或 Pp 二 0.494. 则 拟 合 的 二 项 分 布 为 p( 久 ) = 


5 
| | 0.49450. 506°, 
X 


R 7.4 列 出 了 这 些 概 率 以 及 期 望 中 (理论 上 ) 的 和 实际 中 的 频数 . 可 见 拟 合 的 效果 挺 好 . 拟 合 的 
优 度 问题 将 在 习题 12.12 中 讨论 . 






出 现 正面 的 次 数 (X) 
33.2 或 33 
161.9 8 162 
316.2 或 316 
308.7 或 309 
150.7 2 151 
29.4 9 29 








л e ш N = 





用 概率 图 纸 判 断 表 2.1 中 的 频数 分 布 能 否 用 正 态 分 布 较 好 地 近似 ， 
МО 首先 将 给 定 的 频数 分 布 转变 为 一 个 累积 频率 分 布 ,如 表 7.5 所 示 . 然 后 在 特定 的 概率 图 纸 


上 上 画 出 用 百分数 表示 的 累积 频率 分 布 对 上 界 的 散 点 图 , mE 7-10. 图 中 所 画 点 的 共 线 程度 决定 了 给 
定 的 分 布 能 否 用 一 个 正 态 分 布 很 好 地 拟 合 . 可 见 ， 存在 一 个 正 态 分 布 能 够 很 好 地 拟 合 数据 (见习 题 
7.33). 


7.33 


身高 (英寸 ) 累积 频率 (% ) 
小 于 62.5 5.0 
小 于 65.5 23.0(c1) 
小 于 68.5 65.0 
小 于 71.5 92.0 
小 于 74.5 100.0 


айап 
ББТР 
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身高 〈 英 寸 ) 


图 7-10 


拟 合 一 个 正 态 曲线 使 之 适合 表 2.1 中 的 数据 . 


У(Х) | 组 界 的 x 值 
59.5 


-2.72 


457.6 















正 态 曲 线 下 0 


FAH) 和 z 之 间 的 面积 


观测 的 频数 





0.0413 4.13 或 4 









0.4967 
















62.5 0.4554 20.68 ЕЁ 21 18 
一 68 0.2486 
66—6 | 38.92 或 39 42 
69—71 0.1406 
72—74 0.4177 7.43 或 7 8 





0.4920 





Х =67.45 英寸 ;=2.92 英寸 


解 F 可 按 表 7.6 进行 分 组 .用 ==( 和 一 束 )/， 计算 每 一 组 的 组 界 ,其 中 均值 Х 和 标准 差 ;已 分 
别 在 习题 3.22 和 4.17 PRE, 

在 表 7.6 中 的 第 4 列 , 正 态 曲线 下 方 0 和 xz 之 间 的 面积 已 从 附录 I 中 查 到 .由 此 , 可 求 出 正 态 曲 
线 下 方 在 连续 的 z 值 之 间 的 面积 , 如 第 5 列 所 示 . 得 到 这 些 面 积 的 方法 是 ; 当 连 续 的 z 值 同 号 时 ,将 
相应 的 第 4 列 中 的 连续 的 面积 相 减 ; 异 号 时 则 相 加 ( 表 中 只 出 现 一 次 这 样 的 情况 》， 由 图 形 可 以 很 容 
易 地 看 出 这 样 做 的 理由 . 

将 第 5 列 的 值 (表示 频率 ) 乘 以 总 频数 N( 此 时 N= 100) 得 到 期 望 的 频数 ,如 第 6 列 所 示 . 可见 它 


们 都 和 第 7 列 中 的 真实 (或 观测 ) 的 频数 很 吻合 . 
如 有 和 需要 ,可 用 Sheppard 的 方法 修正 标准 差 ( 见 习题 4.21(a)). 
这 一 分 布 的 拟 合 优 度 将 在 习题 12.13 中 讨论 . 



















7.34 Ж7.7 表示 的 是 一 座 城市 在 50 天 里 每 天 发 生 X 起 交通 事故 的 天 数 . 拟 合 一 个 泊 松 分 
布 使 之 适合 这 些 数 据 . 
表 7.7 
交通 事故 的 次 数 (X) 天 数 ( у) 
0 21 
1 18 
2 7 
3 3 
4 і 
- M 50 
解 F 事故 的 平均 数 是 
_ 210Х _21х0+18х1+7х2+3х3+1х4 45 
А= у = 50 50 0:90 
则 根据 泊 松 分 布 
-0.90 
P(X 起 事故 ) = 小 90 一 
表 7.8 列 出 了 由 这 个 泊 松 分 布 算出 的 发 生 0,1,2,3 和 4 起 事故 的 概率 以 及 期 望 中 或 理论 上 发 
+ X 起 事故 的 天 数 (分 别 用 概率 乘 以 50). 为 了 便于 比较 ,第 4 列 中 重复 列 出 了 表 7.7 中 的 实际 天 
Ж. 
可 见 泊 松 分 布 是 所 给 数据 的 较 好 拟 合 . 
对 于 一 个 真正 的 泊 松 分 布 ,方差 vc2 = 1. 计算 给 定 的 频数 分 布 的 方差 得 到 0.97. 将 此 值 与 1 的 值 
0.90 比较 ,进一步 说 明了 泊 松 分 布 是 样本 数据 的 较 好 的 拟 合 . 
表 7.8 
交通 事故 的 次 数 (XX) 
0 20.33 或 20 
1 18.30 或 18 
2 8.24 或 8 7 
3 2.47 或 2 3 
4 0.56 或 1 
补充 习题 
二 项 分 布 
‚ 10! 9 11 6 
7.35 计算 (a) 71,(b) 61 41 | | А | ol j . 
7.36 将 下 列 各 式 展开 (а) (а+щ)!,(Ъ) (а+ь)!°. 
7.37 М Уут 6 次 , 求 分 别 有 (a) О, (b) 1,(c) 2, (d) 3, (е) 4, (£)5, (g) 6 次 出 现 正面 的 概率 . 
7.38 ” 抛 撕 一 枚 均匀 硬币 6 次 , 求 分 别 有 (a) 不 少 于 2 次 , (b) 少 于 4 次 出 现 正面 的 概率 . 
7.39 WRA X 表示 抛 毛 4 枚 均匀 硬币 1 次 出 现 正 面 的 硬币 个 数 , 求 (a) P(X=3),(b) Р(Х<2), (с) Р(Х 
<2), (d) P(1 < Х<3). 
7.40 


在 拥有 5 个 孩子 的 800 个 家 庭 中 ， 预计 有 多少 个 家 庭 有 (a) 3 个 男孩 , (b) 5 个 女孩 , (с) 2 个 或 3 个 男 
孩 ? 假定 男孩 和 女孩 出 生 的 概率 是 相同 的 . 


7.41 抛掷 一 对 均匀 贫 子 两 次 , 求 有 (a) 一 次 ,(b) 两 次 点 数 和 为 11 的 概率 . 

7.42 ” 抛 撞 一 对 均匀 最 子 三 次 , 求 众 好 有 一 次 点 数 和 为 9 的 概率 . 

7.43 EE 10 题 的 是 非 题 测验 中 , 至 少 答对 6 题 的 概率 是 多 少 ? 

7.44 ”一 位 保险 经 纪 人 向 5 个 人 卖 出 了 保险 ,他们 的 年 龄 相同 且 身 体 状 况 良 好 .根据 保险 表 , 这 个 年 龄 的 人 


再 活 30 年 的 概率 是 -全 R 30 年 后 , (a) 5 个人, (b) 至 少 3 个 人 ,(c) 只 有 2 个 人 ,(d) 至 少 1 个 人 在 世 
的 概率 . 

7.45 ”计算 二 项 分 布 的 (a) 均值 , (b) 标准 差 , (с) 矩 偏 度 系数 , (а) 矩 峰 度 系数 .其 中 =0.7, М = 60. 并 解释 
所 得 的 结果 . 

7.46 证明: 如果 一 个 N = 100 的 二 项 分 布 是 对 称 的 , 则 它 的 矩 峰 度 系数 是 2.98. 

7.47 ”对 于 二 项 分 布 ,计算 (a) D(X -uV PX), (b) 5(Х—-н)%р(Х). 

7.48 ”用 本 章 开始 处 提 到 的 公式 (1) 和 公式 (2) 计 算 和 矩 偏 度 系数 和 和 矩 峰 度 系 数 ， 


正 态 分 布 


7.49 ”一 次 统计 学 测验 的 , 均 分 是 78, 标准 差 是 10. 

(a) 求 93 分 和 62 分 分 别 对 应 的 标准 分 数 . 
(b) 求 标准 分 为 -0.6 和 1.2 所 对 应 的 分 数 . 

.50 ”在 一 次 测验 中 ,70 分 和 88 分 对 应 的 标准 分 数 分 别 是 -0.6 和 1.4, 求 (a) 均 分 , (b) 标准 差 . 

.$51 ” 求 正 态 曲 线 下 方 在 (а) z= -1.20 和 z=2.40 之 间 ,(b) z=1.23 和 z=1.87 之 间 , (с) z= -2.35 和 
z= — 0.50 之 间 的 面积 . 

7.52 ” 求 正 态 曲线 下 方 (a) 在 z= -1.78 的 左 方 ,(b) 在 z=0.56 的 左 方 , (с) Ж z=- 1.45 的 右 方 , (d) 对 应 

于 z 之 2.16,(e) 对 应 于 -0.80 委 > 委 1.53, (0) 在 z= —2.52 的 左 方 ,z =1.83 的 右 方 的 面积 . 
7.53 ШЖ z 服从 均值 为 0, 方 差 为 1 的 正 态 分 布 , 求 (a)P(z 宇 -1.64),(b) P( 1.96 委 z 委 1.96),(c)P(| 
2 |221). 
7.54 Ж: 值 ,使 得 (a) = 右 方 的 面积 是 0.2266, (Ь) z 左 方 的 面积 是 0.0314, (с) -0.23 和 z 之 间 的 面积 是 
0.5722, (d) 1.15 和 = 之 间 的 面积 是 0.0730,(e) — = 和 >z 之 间 的 面积 是 0.9000 其 中 子 服从 均值 为 0. 
方差 为 1 的 正 态 分 布 . 
-55 K 8 Р(2221) =0.84, Ж: 服从 均值 为 0, 方差 为 1 的 正 态 分 布 . 
.56 ” 求 正 态 曲线 在 (а) z=2.25,(b) z= -0.32,(c) z= -1.18 处 的 纵 坐标 . 
‚57 WMR 300 名 学 生 的 身高 服从 均值 为 68.0 英寸 ,标准 差 为 3.0 英寸 的 正 态 分 布 . 那么 有 多 少 名 学 生 的 
身高 满足 下 列 条 件 ? 假定 记录 测量 结果 时 保留 到 最 近 的 整数 . (a) 大 于 72 英寸 , (b) 小 于 或 等 于 64 
英寸 , (c) 65 英寸 和 71 英寸 之 间 , (а) 等 于 68 英寸 . 
7.58 ”如 果 轴 承 滚 珠 的 直径 服从 均值 为 0.6140 英寸 ,标准 差 为 0.0025 英寸 的 正 态 分 布 . 求 轴承 滚珠 的 直径 
满足 下 列 条 件 的 百分比 :(a) 0.610 英寸 和 0.618 英寸 之 间 , (b) 大 于 0.617 Жз}, (с) 小 于 0.608 Ж 
才 ,(d) 等 于 0.615 英寸 . 

7.59 一 次 期 终 考试 的 平均 分 是 72, 标准 差 是 9. 得 分 在 前 10% 的 学 生得 А. 一 名 学 生 要 想 得 A, 最 低 要 得 多 
少 分 ? 

7.60 ”假设 一 组 测量 数据 服从 正 态 分 布 , 则 满足 下 列 条 件 的 数据 所 占 的 百分比 是 多 少 ? (a) 和 均值 的 差 大 于 
标准 差 的 一 半 , (b) 和 均值 的 差 小 于 标准 差 的 四 分 之 三 . 

7.61 ”假设 一 组 测量 数据 服从 均值 为 六 ,标准 差 为 ， 的 正 态 分 布 . 则 满足 下 列 条 件 的 数据 所 占 的 百分比 是 多 
少 ? (a) Æ X *25 ZW, (b) ЕХ +1.25 之 外 , (с) KFX -1.5s. 

7.62 在 习题 7.61 中 , 求 常数 a 使 得 百分比 满足 下 列 条 件 :(a) ТЕХ tas 之 内 的 占 75% (b) 小 于 X -as 的 
占 22%. 


二 项 分 布 的 正 态 逼近 


7.63 ”抛掷 一 枚 均匀 硬币 200 次 , 求 下 列 事件 发 生 的 概率 , (а) 80 至 120 次 出 现 正面 ,(b) 少 于 90 次 出 现 正 
面 ,(c) 少 于 85 次 或 多 于 115 次 出 现 正面 ,(d) 正好 100 KERET. 

7.64 在 一 次 是 非 题 测验 中 , 求 一 名 学 生 猜 对 题 的 情况 满足 下 列 条 件 的 概率 . (a) 20 题 中 能 猜 对 12 题 或 12 
题 以 上 , (b) 40 题 中 能 猜 对 24 题 或 24 题 以 上 . 


ч ч 


ч чо м 


7.65 一 台 机 器 生产 的 螺栓 中 有 10% 是 次 品 , 从 中 随机 抽取 400 个 样品 , 求 次 品 数 量 满足 下 列 条 件 的 概率 : 
(а) 2 5 30 1, (Ь) 30 2 50, (с) 35 至 45 个 ,(d) 不 少 于 55 个 . 
7.66 095—517 578-7 100 次 , 求 2$ 次 以 上 得 到 点 数 和 为 7 的 概率 . 


间 松 分 布 


7.67 ”假设 一 家 公司 生产 的 灯泡 中 有 3% 是 次 品 , 求 100 个 样品 中 次 品 数 满足 下 列 条 件 的 概率 :(a) 0 个 , (Ь) 
1 个 ,(c) 2 个 ,(d) 3 个 ,(e) 4 个 , (0 5 个 . 

7.68 ”在 习题 7.67 中 , 求 次 品 数 满足 下 列 条 件 的 概率 ;(a) 多 于 5 个 ,(b) 1 至 3 个 ,(c) 不 多 于 2 个 . 

7.69 ”一 个 袋子 里 装 有 1 个 红 球 和 7 个 白 球 ,从 中 有 放 回 地 抽 球 8 次 ,每 次 1 个 .分 别 用 下 列 两 种 方法 求 从 中 
抽取 8 个 球 恰好 有 3 个 红 球 的 概率 :(a) 二 项 分 布 , (b) 二 项 分 布 的 泊 松 遂 近 . 

7.70 ”根据 美国 健康 教育 福利 部 门 的 国家 生死 统计 办 公 室 的 数据 显示 , 在 美国 每 年 每 100 000 人 中 发 生 3.0 
起 溺水 事故 . 求 在 一 个 拥有 200 000 人 口 的 城市 里 每 年 发 生 的 渭水 事故 的 次 数 满足 下 列 条 件 的 概率 . 
(a) 0 K, (b) 2 Ж, (с) 6 次 ,(d) 8 次 ,(e) 4 次 和 8 KZE, (0) 少 于 3 次 . 

7.71 在 下 午 2 点 和 4 点 之 间 , 某 公司 总 机 每 分 钟 接 到 2.5 个 电话 . 求 在 某 一 分 钟 内 电话 个 数 满足 下 列 条 件 
的 概率 ;(a) 0 个 ,(b) 147, (с) 2 个 ,(d) 3 个, (е) 不 多 于 4 个 ， ({) 多 于 6 个 . 


多 项 分 布 


7.72 抛 毛 一 个 均匀 山子 6 次 , 求 下 列 事件 发 生 的 概率 ;(a) 出 现 1 个 1,2 个 2 和 3 个 3, (b) 每 一 面 出 现 一 
次 . 

7.73 ”一 个 盒子 里 有 大 量 的 红 球 、 白 球 . 蓝 球 和 黄 球 ,所 占 的 比例 为 4:3:2:1. 从 中 抽取 10 个 球 , 求 抽 到 下 列 
球 的 概率 ;(a) 4 个 红 球 ,3 个 白 球 ,2 个 蓝 球 和 1 个 黄 球 , (b) 8 个 红 球 和 2 NRR. 

7.74 ” 抛 指 一 个 均匀 骨 子 4 次 , 求 一 次 也 得 不 到 1，2 或 3 的 概率 . 


用 数据 拟 合 理论 分 布 
7.75 用 表 7.9 中 的 数据 拟 合 二 项 分 布 . 


7.76 用 概率 图 纸 判 断 习题 3.59 中 的 数据 的 频率 分 布 能 否 用 正 态 分 布 很 好 地 近似 | 

7.77 用 习题 3.59 中 的 数据 拟 合 正 态 分 布 . 

7.78 用 习题 3.61 中 的 数据 拟 合 正 态 分 布 . 

7.79 用 习题 7.75 中 的 数据 拟 合 泊 松 分 布 ,并 和 二 项 分 布 的 拟 合 相 比较 . 

7.80 %7.10 列 出 了 20 年间 (1875 至 1894)10 文 普鲁士 军队 中 每 年 被 马 踢 死 的 人 数 .用 这 些 数据 拟 合 泊 松 
分 布 . 


表 7.10 


第 八 章 和 初等 抽样 理论 


抽样 理论 


抽样 理论 研究 的 是 总 体 和 从 总 体 中 抽取 的 样本 之 间 的 关系 , 在 许多 方面 都 有 重要 的 应 用 
价值 .例如 , 可 通过 样本 的 茶 些 量 ( 如 样本 均值 和 方差 ) 来 估计 总 体 的 相应 量 ( 如 总 体 均 值 和 方 
Ж), 即 佑 计 总 体 参 数 或 简称 参数 , 这 就 是 抽样 统计 , 简称 统计 .有 关 估 计 的 问题 将 在 第 九 章 讨 
论 . 

抽样 理论 还 可 用 以 判断 两 样本 之 间 的 差异 性 是 出 于 偶然 的 偏差 还 是 它们 之 间 真 的 有 差 
异 . 例 如 在 检验 某 种 新 药 是 否 有 效 或 判断 某 种 生产 线 是 否 优 于 其 他 生产 线 时 ,常会 遇 到 类 似 问 
题 . 回 答 这 些 问 题 就 要 用 到 所 谓 的 显著 性 检验 和 假设 检验 , 这 在 决策 论 中 是 非常 重要 的 ,将 在 
第 十 章 子 以 讨论 . 

一 般 说 来 ,利用 从 总 体 中 抽取 的 样本 对 总 体 作出 推断 以 及 用 概率 论 的 理论 对 这 种 推断 的 
准确 性 作出 提示 ,这 些 就 称 为 统计 推断 . 


随机 样本 和 随机 数 


为 了 保证 抽样 理论 和 统计 推断 的 结论 能 够 成 立 , 选择 的 样本 必须 是 总 体 的 代表 .由 此 引出 
的 对 抽样 方法 以 及 相关 问题 的 研究 称 为 试验 设计 . 

获得 有 代表 性 的 样本 的 方法 之 一 是 随机 抽样 , 即 总 体 中 的 个 体 被 抽 到 的 机 会 是 均等 的 . 可 
以 给 总 体 中 的 每 个 个 体 编 一 个 号 码 , 将 这 些 数 字 写 在 小 纸 片 上 , ARETE, 然后 再 从 中 抽取 . 
要 注意 的 是 在 每 次 抽取 之 前 都 要 搅拌 充分 . 另 一 个 可 供 选择 的 方法 是 用 为 此 专门 设计 的 随机 
数 表 ( 见 附录 到 ) .可 参见 习题 8.6. 


有 放 回 和 无 放 回 抽 样 


从 负 子 里 抽取 一 个 数 后 , 在 抽取 第 二 个 数 之 前 我 们 可 以 选择 将 该 数字 放 回 或 不 放 回 .在 第 
一 种 情况 下 , 一 个 数字 可 以 一 次 又 一 次 重复 出 现 , 而 在 第 二 种 情况 下 , 每 个 数字 只 能 出 现 一 次 . 
总 体 中 的 每 个 个 体 可 以 不 止 一 次 地 被 选中 的 抽样 叫做 有 放 回 抽样 , 如 果 每 个 个 体 被 选中 的 次 
数 不 多 于 一 次 , 则 叫 无 放 回 抽 样 . 

总 体 可 以 是 有 限 的 ,也 可 以 是 无 限 的 . 比如 说 , 如 我 们 从 一 个 装 有 100 个 球 的 镀 子 里 无 放 
回 地 连续 抽取 10 个 球 , 那 就 是 从 一 个 有 限 的 总 体 中 抽样 ;如 果 我 们 抛掷 一 枚 硬币 50 次 ,记录 
正面 出 现 的 次 数 ,我 们 就 是 从 一 个 无 限 的 总 体 中 抽样 . 

从 理论 上 来 说 ,对 于 有 放 回 抽样 , 由 于 无 论 从 总 体 中 抽取 了 多 少 个 样本 , 都 不 会 使 总 体 变 
小 ,有 限 的 总 体 也 可 看 成 是 无 限 的 .出 于 许多 实际 的 考虑 , 当 总 体 很 大 时 ,从 有 限 的 总 体 中 抽样 
也 可 看 成 是 从 无 限 的 总 体 中 抽样 . 


抽样 分 布 


考虑 从 一 个 给 定 的 总 体 中 抽取 (不 论 是 否 有 放 回 ) 容 量 (或 大 小 ) 为 N 的 所 有 可 能 的 样本 . 
对 于 每 一 个 样本 , 我 们 可 计算 出 某 个 统计 量 (如 样本 均值 或 标准 差 ) 的 值 , 不同 的 样本 得 到 的 该 
统计 量 的 值 是 不 一 样 的 .用 这 样 的 方法 我 们 能 得 到 这 个 统计 量 的 分 布 , 称 之 为 抽样 分 布 . 

例如 , 如果 特 指 的 统计 量 是 样本 均值 , 则 此 分 布 称 为 均值 的 抽样 分 布 . 类似 地 , 我 们 可 以 得 
到 标准 差 .方差 .中 位 数 、 比 例 的 抽样 分 布 等 . 

对 于 每 个 统计 量 的 抽样 分 布 , 可 计算 出 它 的 均值 和 标准 差 等 .我 们 称 之 为 该 统计 量 抽样 分 
布 的 均值 和 标准 差 等 , 或 简称 为 该 统计 量 的 均值 和 标准 差 等 ， 


均值 的 抽样 分 布 


假设 从 一 个 容量 为 N, 的 有 限 总 体 中 无 放 回 地 抽取 了 所 有 的 容量 为 N 的 样本 , М, > М. 
分 别 用 ys 和 os 记 均 值 的 抽样 分 布 的 均值 和 标准 差 ,用 jy 和 a 记 总 体 的 均值 和 标准 差 , 则 
-CQ _ N,- N (1) 
нұ TA бх 一 JN N -1 
如 果 总 体 是 无 限 的 或 抽取 是 有 放 回 的 ,上 述 结果 变 为 


Lx Ин ох = 79 (2) 


当 N 较 大 时 (CN 之 30), 无论 总 体 如 何 (只 要 总 体 的 均值 和 方差 有 限 且 总 体 的 容量 至 少 是 
笠 本 容量 的 两 倍 ), 均值 的 抽样 分 布 都 近似 于 一 个 均值 为 wx , 标准 差 为 oz 的 正 态 分 布 .车 总 体 
是 无 限 的 ,这 一 结论 就 是 现代 概率 论 中 的 中 心 极限 定理 的 一 个 特例 , 它 说 明 N 越 大 , 这 种 近似 
效果 越 好 .我 们 有 时 也 说 这 个 抽样 分 布 是 近似 正 态 的 . 

如 果 总 体 服从 正 态 分 布 ,即使 N 较 小 (如 N<30) ,均值 的 抽样 分 布 也 是 正 态 的 . 
比例 的 抽样 分 布 


假设 总 体 是 无 限 的 且 某 事件 发 生 ( 称 为 成 功 ) 的 概率 是 p, 而 该 事件 不 发 生 ( 称 为 失败 ) 的 
慨 率 是 9 =1- 户 .例如 , 总体 是 抛掷 一 枚 均匀 硬币 任意 次 的 结果 , 其 中 正面 出 现 的 概率 是 p = 
方 . 考 虑 从 中 抽取 的 所 有 容量 为 N 的 样本 ,并 对 每 个 样本 求 该 事件 发 生 的 比例 P. 例 如 ,PP 就 
是 抛 括 一 枚 均匀 硬币 NN 次 正面 出 现 的 比例 . Р 的 抽样 分 布 称 为 比例 的 抽样 分 布 , 它 的 均值 Hp 


PIREZ o, 分 别 为 
tp = JẸ- [POA з) 


将 j=p Жо = / 加 代入 (2) 式 也 可 得 上 式 . 当 NN 很 大 时 (N 宇 30), 这 个 抽样 分 布 非常 接近 于 
正 态 分 布 .注意 ,总体 服 从 二 项 分 布 . 

当 总 体 有 限 且 抽 样 有 放 回 时 , (3) 式 也 成 立 .而 当 总 体 有 限 且 抽样 无 放 回 时 , (3) 式 不 再 成 
立 , 成 立 的 是 将 и = р 和 o= VY pg 代入 (1) 式 所 得 的 式 子 . 

显然 ,用 N 除 二 项 分 布 的 均值 和 标准 差 ( Np 和 VNzpg ) 即 得 (3) 式 ( 见 第 七 章 )， 


差 与 和 的 抽样 分 布 

假设 有 两 个 给 定 的 总 体 ,对 于 从 第 一 个 总 体 中 抽取 的 每 一 个 容量 为 N 的 样本 , 可 计算 统 
ИЕ $1. 进而 可 求 出 S, 的 抽样 分 布 , 它 的 均值 和 标准 差分 别 记 为 xs 和 o, .同样 地 ,对 于 从 第 
二 个 总 体 中 抽取 的 每 一 个 容量 为 N 的 样本 , 可 计算 统计 量 5, 进而 可 求 出 S, 的 抽样 分 布 
它 的 均值 和 标准 差分 别 记 为 ws 和 os .结合 从 两 个 总 体 中 抽取 的 样本 , 我 们 可 得 到 差 值 S - 
Sa 的 分 布 , 称 为 统计 量 之 差 的 抽样 分 布 .这 一 分 布 的 均值 和 标准 差分 别 记 为 x。 。 和。 
如 果 所 抽取 的 样本 互 不 依赖 ( 即 样本 是 独立 的 ), 则 有 Е 


Fsi-s, 7 5, р Hs, 05,-5, ~ y 25 + 25, (4) 
如 果 5, 和 5, 指 的 是 两 个 总 体 的 样本 均值 ,分 别 用 Xi 和 Х, 表示 ,那么 对 于 均值 和 标准 
(и, о) (и, 02) 的 两 个 无 限 的 总 体 , 均值 之 差 的 抽样 分 布 是 一 定 的 , 利用 (2) 式 


可 得 
2 2 
“ӯ = -一 Ey 一 Ey = 4 -一 Os _- = д2. + в, — 21 + 2 (5) 
Х,-Х, X Х, 1 #2 буу, X, X% NN N, 


5,78,’ 


如 果 总 体 有 限 但 抽取 是 有 放 回 的 , 结论 仍然 成 立 . 如 果 总 体 有 限 但 抽取 是 无 放 回 的 , 可 由 (1) 式 
得 到 类 似 的 结论 . 

对 于 两 个 参数 分 别 为 (p1, gi1) 和 (p,, 9;) 的 服从 二 项 分 布 的 总 体 ,关于 比例 之 差 的 抽样 分 
布 也 能 得 到 相应 的 结论 .此 时 , 5, 和 5, 相当 于 成 功 的 比例 Р, 和 Р,, 由 (4) 式 可 得 


[775 2 | pıqı P2q2 
— — — — 一 = 一 ”十 一 


看 Ni 和 N 较 大 (Ni, N; 之 30), 均 值 之 差 或 比例 之 差 的 抽样 分 布 都 接近 于 正 态 分 布 . 

有 时 也 要 用 到 统计 量 之 和 的 抽样 分 布 .如 果 样 本 是 独立 的 ,这 一 分 布 的 均值 和 标准 差 为 

Hs +5, = 5, + Ё.» 05 +5, 一 y os 十 25 (7) 

标准 误差 

一 个 统计 量 的 抽样 分 布 的 标准 差 常 称 为 该 统计 量 的 标准 误差 . 表 8.1 列 出 了 从 无 限 总 体 
(或 很 大 总 体 ) 中 随机 抽样 或 从 有 限 总 体 中 有 放 回 抽样 所 得 的 不 同 统计 量 的 抽样 分 布 的 标准 误 
差 . 表 中 也 注 明 了 结论 成 立 所 需 的 条 件 以 及 其 他 一 些 重 要 的 结论 . 

рс, р, и, 和 X,s,P,mr 分别 表示 总 体 和 样本 的 均值 标准 差 . 比 例 及 均值 的 > ИЧЕ. 

要 注意 的 是 , 当 样 本 容量 足够 大 时 , 抽样 分 布 是 正 态 或 接近 于 正 态 的 , 与 之 相关 的 方法 称 
为 大 样本 方法 . 当 N < 30 时 ,样本 容量 较 小 , 与 之 相关 的 理论 称 为 精确 抽样 理论 ， 这 将 在 第 
十 一 章 讨论 . 

知 样 本 的 某 些 参数 如 о, p Ryu, 未 知 ,而 样本 容量 足够 大 ， 岂可 用 与 之 相对 应 的 样本 统计 
量 (或 83= VN/(N 一 1)s),P 和 mx, 对 其 作出 较 好 的 估计 . 


表 8.1 抽样 分 布 的 标准 误差 





抽样 分 布 标准 误差 注释 
对 于 小 样本 和 大 样本 结论 均 成 立 . 当 N >30 时 ,即使 总 
均值 оз = 万 体 是 非 正 态 的 ,均值 的 抽样 分 布 也 是 非常 接近 于 正 态 分 
fi. 在 所 有 情况 下 ， ExT’ 即 等 于 总 体 均值 
对 于 均值 的 注释 也 适用 于 此 
_ [001- р) /pg 
4 Ор м үк 在 所 有 情况 下 , wp = р 





当 N 之 100 Ht, s 的 抽样 分 布 是 非常 接近 于 正 恋 的 . 





(1)о,= A 若 总 体 是 正 态 的 (或 近似 于 正 态 ),o 由 (1) 式 给 出 . 
标准 差 若 总 体 是 非 正 态 的 , о, 由 (2) 式 给 出 . 注意 : 当 总 体 服 从 
(2) o, = | 正 态 分 布 时 ,(2) 式 中 的 p= о2, р, = 3в*, (2) 式 简化 为 


(1) 式 . 当 №2100 时 , x, = о 近似 成 立 . 





当 N 之 30 时 , 中 位 数 的 抽样 分 布 是 非常 接近 于 正 态 的 . 











中 位 数 s =o |Z -125330 只 有 当 总 体 服从 正 态 (或 近似 于 正 态 ) 分 布 时 , 所 给 的 结 
= УМ JN 论 才能 成 立 . 
Hnmd— Р 
对 于 中 位 数 的 注释 也 适用 于 此 . 
第 1 个 四 分 位 数 和 , 
第 3 个 四 分 位 数 бе = без = 018 по! mas 分 别 与 总 体 的 第 1 个 四 分 位 数 和 第 3 个 四 分 


位 数 近 似 相 等 .注意 :oo,=o, 





续 表 











抽样 分 布 标准 误差 注释 
_ _ 1.70940 
äp #0 УМ 
1.42885 对 于 中 位 数 的 注释 也 适用 于 此 . 
N CD2 брв — JN HDi» р)?» 一 分 别 与 总 体 的 第 1 个 ,第 2 个 ， teroare 十 分 位 数 
70и an= g = 31800 近似 相等 . 
>O VN 注意 :cps=a ned 
А А _ 1.26800 
ра рб /М 
0.78670 对 于 中 位 数 的 注释 也 适用 于 此 
Ад бат N pa 和 总 体 的 半 内 四 分 距 近似 相等 
(1)в;2=в° J2 对 于 标准 差 的 注释 也 适用 于 此 .注意 ; 当 总 体 服从 正 态 分 
方差 =з; 布 时 , (2) 式 可 化 为 (1) 式 . 
-12 us? =0°(N-1)/N,% МАКЕ, EH o? 很 接近 . 
(2) cs2 = N 
v=o/u 是 总 体 的 变异 系数 .只 有 当 N2100 
ях y= /т+2уъ? си 
变异 系数 RY e 和 总 体 为 正 态 (或 近似 正 态 ) 时 ,结论 才 成 立 


习题 及 解答 
均值 的 抽样 分 布 


8.1 一 个 总 体 包 含有 5 个 数 , 即 2,3，6,8 和 11. 考 察 从 总 体 中 有 放 回 抽取 得 到 的 所 有 容量 
为 2 的 样本 . 求 (a) 总 体 的 均值 , (b) 总 体 的 标准 差 , (c) 样本 均值 抽样 分 布 的 均值 , (d) 
样本 均值 抽样 分 布 的 标准 差 ( 即 样本 均值 的 标准 误差 ). 


解 EF (a) p= 6.0 


(b) 


„2- 00-6) + 3-6) + (6 – 6)? + (8-6) + 01-6}? 


5 


_16+9+0+4+25 | 
а 5 ~= 


10.8 
则 с= 3.29. 
(c) 从 总 体 中 有 放 回 抽取 得 到 的 容量 为 2 的 样本 共有 25 个 (因为 第 一 次 抽 到 的 5 个 数 中 的 任 -- 个 可 和 
第 二 次 抽 到 的 5 个 数 中 的 任 一 个 相 结合 考虑 ) .它们 是 
(2,2) (2,3) (2,6) (2,8) (2,11) 
(3,2) (3,3) (3,6) (3,8) (3,11) 
(6,2) (6,3) (6,6) (6,8) (6,11) 
(8,2) (8,3) (8,6) (8,8) (8,11) 
(11,2) (11,3) (11,6) (11,8) (1,11) 
相应 的 样本 均值 是 
20 25 40 50 65 
2.5 30 45 55 70 
40 45 60 70 85 (8) 
50 55 70 80 95 
65 70 85 95 1.0 
样本 均值 抽样 分 布 的 均值 是 


8.2 


8.3 


8.4 


_ (8) 式 中 所 有 样本 均 _ 150 _ 
一 К = 6.0 


25 

说 明 yg = р. 

(d) 要 求 样本 均值 抽样 分 布 的 方差 cx , 先 将 (8) 式 中 的 每 一 个 数字 减 去 均值 6, 将 所 得 的 结果 平 
方 ,再 把 得 到 的 25 个 数字 相 加 所 得 的 和 除 以 25. 最 终 的 结果 是 07 = 135/25 = 5.40, 则 оу = /5.40 = 
2.32. 这 一 结果 说 明 : 对 于 有 限 总 体 中 的 有 放 回 抽样 (或 无 限 总 体 ), cx = c?/N. 等 式 右边 得 10. 8/2 = 
5.40, 和 上 面 求 得 的 值 很 吻合 . 
如 果 抽 样 不 是 有 放 回 的 ,求解 习题 8.1. 
# S 如 习题 8.1 中 的 (a) 和 (b), p=6 且 og=3.29. 
(с) 从 总 体 中 无 放 回 ( 即 先 抽出 一 个 数 , 抽 到 的 第 二 个 数 和 第 一 个 不 同 ) 地 抽取 所 有 容量 为 2 的 样本 共 


有 | ?| =10 个 :(2,3),(2,6), (2,8), (2,11), (3,6), (3,8), (3,11), (6,8), (6, 11) 和 (8,11). 例 如 , 抽 到 


(2,3) 和 抽 到 (3,2) 可 认为 是 一 样 的 . 
相应 的 样本 均值 是 2.5,4.0,5.0,6.5,4.5,5.5,7.0,7.0,8.5 和 9.5. 样 本 均值 抽样 分 布 的 均值 是 


2.5+4.0+5.0+6.5+4.5+5.5+70+7.0+8.5+9.5 
Hg = 10 = 6.0 


说 明 нұ и. 
(4) 样本 均值 抽样 分 布 的 方差 是 








两 者 完全 吻合 

假设 一 所 大 学 的 3000 名 男 学 生 的 身高 服从 均值 为 68.0 英寸 ,标准 差 为 3.0 英寸 的 正 
态 分 布 .如 果 有 80 组 样本 , 每 组 有 25 名 学 生 . 若 (a) 抽取 是 有 放 回 的 , (b) 抽取 是 无 放 
回 的 , 样本 均值 抽样 分 布 的 期 望 的 均值 和 标准 差 是 多 少 ? 


解 F 从 理论 上 来 说 , 能够 从 3000 名 学 生 中 有 放 回 和 无 放 回 地 抽取 容量 为 25 的 样本 各 有 300025 


3000 
个 和 | | 个 远大 于 80. 因此 ,我 们 不 能 得 到 样本 均值 的 真正 的 抽样 分 布 , 而 只 能 得 到 经 验 的 抽样 


分 布 .不 仅 如 此 ,由 于 样本 的 数量 很 大 , 这 两 种 抽样 分 布 应 该 很 接近 .因此 可 按 (1)， (2) 式 来 计算 样本 
均值 经 验 抽样 分 布 的 期 望 的 均值 和 标准 差 . 


(a) ру = и = 68. 0 英寸 县 os =-@=—9— -0.6 英 十 


(b) ру =68.0 Ж-А оу = 7ч мт = = таг а 

这 个 值 只 比 0.6 稍微 小 一 点 ,因此 对 于 本 问题 来 说 无 放 回 抽样 和 有 放 回 抽样 可 看 作 同 样 的 . 

所 以 ,我 们 可 预计 样本 均值 的 经 验 抽样 分 布 近似 于 均值 为 68.0, 标准 差 为 0.6 的 正 态 分 布 ， 

在 习题 8.3 中 , 预计 能 找到 多 少 个 样本 , 使 得 它 的 均值 (ay 在 66 8 英寸 和 68.3 英寸 之 
8], (b) 小 于 66.4 英寸 ? 


解 кє 此 时 ,一 个 样本 均值 的 标准 值 为 


X-u X-680 
бұ 0.6 








(а) 


66.8 的 标准 值 = 0 _ -2.0 


68.3 的 标准 值 = 68.3680 _ 0.5 
如 图 8-1(a) 所 示 


均值 在 66.8 英寸 和 68.3 英寸 之 间 的 样本 比例 
= ( 正 态 曲线 下 x =- 2.0 和 > = 0.5 之 间 的 面积 》 
= (z =- 2.0 2 = 0 之 则 的 面积 )+ (2 = ОЖ = 0.5 之 间 的 面积 ) 
= 0.4772 + 0.1915 = 0.6687 
则 预计 的 样本 数 为 80 x 0.6687 = 53.496, 3 53. 
(Ъ) 


66.4 的 标准 值 = 66.2_—68.0 = – 2.67 


如 图 8-1(b) 所 示 


均值 小 于 66.4 英寸 的 样本 比例 
= ( 正 态 曲 线 下 z = - 2.67 左 方 的 面积 ) 
= (z = 0 左 方 的 面积 ) - (2 =-2.67 和 > = 0 之 间 的 面积 ) 
= 0.5 – 0.4962 = 0.0038 
则 预计 的 样本 数 为 80 х 0.0038 =0.304, 或 0. 


.5 | -2.67 
(b) 


图 8-1 





85 500 个 轴承 滚珠 的 重量 的 均值 为 5.02 克 , 标准 差 为 0. 30 Ж. 从 中 随机 抽取 100 个 轴承 
滚珠, 求 下 列 事件 发 生 的 概率 :(a) 总 重量 在 496 克 和 500 克之 间 , (b) 总 重量 大 于 510 
克 . 


解 КЕ 对 于 均值 的 抽样 分 布 ， у= и = 5.02 克 , 且 


_o [М-М 0.30 300— 100 _ 
ох = —- м1 = у | 500—1 = 0.027 克 
(а) 如 果 100 个 轴承 滚珠 的 平均 重量 在 4.96 克 和 5.00 LE, 那么 它们 的 总 重量 在 496 克 和 500 3 
之 间 . 


_ .96 ~ 5.02 
4.96 的 标准 值 = 23205.02 = — 2.22 


5.00 的 标准 值 = 2 = – 0.74 


如 图 8-2(a) 所 示 
要 求 的 概率 = (z =- 2.22 和 >z =-0.74 之 间 的 面积 ) 
= (z = 一 2.22 和 2 = 0 之 间 的 面积 ) 
— (2 =-0.74 和 xz = 0 之 间 的 面积 ) 
= 0.4868 ~ 0.2704 = 0.2164 
(b) 如 果 100 个 轴承 滚珠 的 平均 重量 超过 5.10 克 ， 那么 它们 的 总 重量 将 超过 510 克 . 


D 5.10-5.02 
5.10 的 标准 值 = 070257 = 2:96 


如 图 8-2(b) 所 示 
要 求 的 概率 = (z = 2.96 右 方 的 面积 
= (z = 0 右 方 的 面积 ) - (= = 0 和 z = 2.96 之 间 的 面积 ) 
= 0.5 - 0.4985 = 0.0015 
因此 ,抽取 含有 100 个 轴承 滚珠 的 样本 2000 个 .只 有 3 个 样本 的 总 重量 超过 510 Ж. 


-2.22 024 。 





图 8-2 


8.6 (а) 如 何 用 随机 数 表 从 表 2.1 中 选取 30 个 随机 样本 ?假设 每 个 样本 包括 4 个 学 生日 抽 
取 是 有 放 回 的 . 
(b) 求 (a) 中 样本 均值 抽样 分 布 的 均值 和 标准 差 . 
(с) 将 (b) 中 的 结果 和 理论 值 相 比较 , 并 解释 和 理论 不 符合 的 地 方 . 
解 F (а) 用 两 位 数 给 100 个 学 生 标 号 :00，01，02, …,99( 见 表 8.2). 则 5 个 身高 为 60 一 62 英寸 


的 学 生 分 别 记 为 00 一 04, 18 个 身高 为 63 一 65 英寸 的 学 生 分 别 记 为 05 一 22 等 .每 个 学 生 的 号 码 叫做 抽 
HEN. 


k 8.2 


身高 (英寸 ) 





我 们 从 随机 数 表 中 抽取 数字 (附录 区 ). 在 第 一 行 我 们 找到 数列 51, 77, 27, 46, 40 等 , 把 它们 作为 
随机 抽样 号 码 , 每 个 号 码 对 应 一 个 它 所 表示 的 学 生 的 身高 .如 51 对 应 于 一 个 66 英寸 ~68 英寸 的 身 
高 , 可 视 为 67 英寸 .类 似 地 ,77,27 和 46 分 别 对 应 于 70 英寸 , 67 英寸 和 67 英寸 的 身高 

这 样 ,我 们 得 到 表 8.3, 表 中 列 出 了 抽取 的 抽样 号 码 、 对 应 的 身高 和 每 个 样本 的 平均 身高 .要 指出 
的 是 , 虽然 我 们 在 第 一 行 就 已 经 引用 了 随机 数 表 , 我 们 仍 可 以 采用 别 的 方式 另 取 其 他 数 . 





表 8.3 
抽取 的 抽样 号 码 。 | ”相应 的 身高 | 平均 身高 | 抽取 的 抽样 号 码 



























































































































































1. 51,77,27,46 67, 70, 67, 67 6. 11,64, 55, 58 64, 67, 67, 67 66.25 
2. 40, 42,33, 12 67,67,67, . 70, 56, 97, 43 70, 67, 73, 67 69.25 
3. 90, 44, 46, 62 70, 67,67, . 74,28, 93, 50 70, 67, 73, 67 69.25 
4. 16, 28, 98, 93 64, 67,73, . 79,42, 71,30 70, 67, 70, 67 68.50 
5. 58, 20, 41, 86 67, 64, 67, - 58,60, 21,33 67, 67, 64, 67 66.25 
6. 19, 64, 08, 70 64, 67, 64, ‚ 75,79, 74, 54 70, 70, 70, 67 69.25 
7. 56, 24, 03, 32 67, 67,61, . 06,31, 04, 18 64, 67, 61, 64 64.00 
8. 34, 91,83, 58 67, 70,70, . 67,07, 12,97 70, 64, 64, 73 67.75 
9. 70, 65, 68, 21 70, 70, 70, 64 ‚ 31,71,69, 88 67, 70, 70, 70 69.25 
10. 96, 02, 13, 87 73,61,64, 70 . 11,64, 21,87 64, 67, 64, 70 66.25 
11. 76,10, 51, 08 70, 64, 67, 64 . 03, 58, 57, 93 61, 67, 67, 73 67.00 
12. 63,97, 45, 39 67, 73,67, 67 . 53,81, 93,88 67, 70, 73, 70 70.00 
13. 05, 81, 45, 93 64, 70, 67, 73 . 23, 22,96,79 67, 64, 73, 70 68.50 
14. 96,01, 73, 52 73,61, 70, 67 .98, 56, 59, 36 73,67, 67,67 68.50 
15. 07, 82, 54,24 64, 70, 67, 67 30. 08,15, 08, 84 64, 64, 64, 70 65.50 











(b) 表 8.4 给 出 了 (a) 中 得 到 的 身高 的 样本 均值 的 频数 分 布 .这 就 是 样本 均值 的 抽样 分 布 . 求 均值 和 标 
准 差 的 方法 仍 是 第 三 章 和 第 四 章 惯用 的 方法 : 


22и _ 67.005 人 全 - 67.58 英寸 








ЖИЕ суи - щы? = с эме (ул) 


66.25 


А -~ 67. 00 


67.75 


68. 50 


69.25 





70.00 


(c) 样 本 均值 的 抽样 分 布 的 均值 yx 应 该 等 于 总 体 的 均值 , Вр 67. 45 英寸 (见习 题 
3.22), 这 和 (b) 中 求 出 的 值 67. 58 英寸 相 一 致 
样本 均值 的 抽样 分 布 的 标准 差 ( 标 准 误差 )o; 应 该 等 于 co/ V 入 ,其 中 总 体 的 标准 差 


o =2.92 Жз} (Ж,2) 4.17), ЖЕ М =4. 则 oc/ VN =2.92//4 = 1.46 英寸 ,和 
Cb) 中 的 值 1.41 英寸 相 一 致 .结果 略 有 出 入 是 因为 只 抽取 了 30 个 样本 且 样 本 容量 (本 
题 中 为 4) 太 小 . 


比例 的 抽样 分 布 


8.7 ИЧА т 120 次 , 求 下 列 事件 发 生 的 概率 :(a) 出 现 正面 的 次 数 占 40% 到 
60%, (b) 出 现 正面 的 次 数 占 训 或 更 多 . 


解 F 解法 一 我们 把 抛掷 硬 征 120 次 看 作 是 从 抛掷 一 枚 硬币 所 有 可 能 的 结果 这 一 无 限 总 体 中 


和 到 的 一 个 样本 .在 总 体 中 出 现 正面 的 概率 为 p= 了 ,出 现 反 面 的 概率 为 a=1- p= 十， 
(a) 我 们 要 求 的 是 在 120 次 中 正面 出 现 的 次 数 在 (120 的 40% )48 和 (120 的 60% )72 之 间 的 概率 . 同 第 


七 章 , 我 们 用 二 项 分 布 的 正 态 下 近来 求 此 概率 . 因为 正面 出 现 的 次 数 是 一 离散 型 变量 , 我 们 改 求 正面 
出 现 的 次 数 在 47.5 和 72.5 之 间 的 概率 ， 


и = 正面 出 现 次 数 的 期 望 值 = Np = 120 x 3 = 60 


s= / Np = 120 х 3 х 1 = 5.48 


47.5 的 标准 值 = 人 =— 2.28 





8.8 


8.9 


р 72.5- 60 _ 
72.5 的 标准 值 = 一 = 2.28 


如 图 8-3， 
要 求 的 概率 = ( 正 态 曲线 下 x =- 2.28 和 > = 2.28 之 间 的 面积 ) 
= 2(z = ОЖ = 2.28 之 间 的 面积 
= 2 x 0.4887 = 0.9774 
解法 二 








_ _ 0.40—-0.50 __ 
40% 的 标准 值 = 0 0456 =-2.19 


_. _ 0.60-0.50 
60% 的 标准 值 = чул = 2-19 


要 求 的 概率 = (ЖЕНЕТ = =-2.19 和 = 2.19 之 间 的 面积 ) 
= 2х 0.4857 = 0.9714 
即使 这 一 结果 已 精确 到 两 位 有 效 数字 ,但 仍 不 能 完全 准确 ， 因为 我 们 并 没有 用 到 比例 实际 上 是 离散 型 


变量 这 一 事实 .为 了 弥补 ,我 们 用 0.40 R- 0.60 mE; 因为 N= 120,54 = 1/240 = 0.00417, 则 要 


2N’ 2N 
求 的 比例 的 标准 值 分 别 为 
0.40 – 0.00417 - 0.50 _ 2.28 419-60 +0.00417 — 0.50 


0.0456 0.0456 
这 样 就 和 解法 一 中 的 结果 一 样 了 . 
注意 ,0.40 -0.00417 和 0.60+0.00417 对 应 于 解法 一 中 的 比例 47.5/120 和 72.5/120. 


(b) 用 (a) 中 解法 二 的 方法 ， m> = 0.6250 


= 2.28 


(0%250 -0.00417) 的 标准 值 = 06230 -0.00417 -0.50 _, g5 


0.0456 
要 求 的 概率 = ( 正 态 曲 线 下 = =2.65 右 方 的 面积 ) 
=(z=0 右 方 的 面积 ) - (z=0 和 z=2.65 之 间 的 面积 ) 
=0.5-0.4960 = 0.0040 


有 500 个 人 , 每 个 人 抛掷 一 枚 均匀 硬币 120 次 .预计 有 多 少 人 能 得 到 : (а) 出 现 正面 的 
次 数 占 40% 到 60% , (b) EMAKAS RES? 


解 E 这 个 问题 和 习题 8.7 密切 相关 .我 们 可 看 成 从 抛掷 一 枚 硬币 的 所 有 结果 这 -无 限 总 体 中 抽 
Ж 500 个 容量 为 120 的 样本 . 
(а) 习题 8.7 中 的 (a) 指 出 :如 果 每 个 样本 包括 抛掷 一 枚 均匀 硬币 120 次 ,那么 在 所 有 可 能 的 样本 中 ， 
出 现 正面 的 次 数 在 40% 和 60% 之 间 的 占 97.74% .因此 ,在 500 个 样本 中 , 我 们 预计 大 约 能 找到 (500 
的 97.74% )489 个 有 如 此 特征 的 样本 .所 以 会 有 489 个 人 报告 说 ,他们 的 试验 结果 出 现 正面 的 次 数 占 
40% 到 60%. 

有 趣 的 是 , 预计 会 有 500-489 =11 个 人 报告 说 ， 出 现 正面 的 次 数 的 百分比 不 在 40% 和 60% 之 
同 .虽然 这 些 人 的 硬币 是 均匀 的 ,但 他 们 也 有 理由 认为 他 们 的 硬币 是 负重 的 .这 种 类 垄 的 错误 正 是 术 
率 中 永远 存在 的 风险 . 


(b) 和 (a) 中 一 样 ,我 们 可 断定 大 约 有 500 x0.0040=2 个 人 报告 出 现 正面 的 次 数 占 坟 或 更 多 ， 


已 知 某 台 机 器 生产 的 工具 中 有 2% 是 次 品 .装运 400 个 这 样 的 工具 , 求 下 列 事件 发 生 的 
ВЕЖ, (а) 次 品 不 少 于 3%, (Ь) 次 品 不 多 于 2% . 


Ж F 
—- -~ /如 _ |0.02х 0.98 0.14 
Hp 0.02 H cp Му 40 = 20 = 0.007 


(a) 解 法 一 ”对 离散 型 随机 变量 进行 修正 ,1/(2N)=1/800=0.00125, 则 有 


-. 0.03 - 0.00125 ~ 0.02 
(0.03 — 0.00125) 的 标准 值 = = 


要 求 的 概率 = ( 正 态 曲 线 下 > = 1.25 右 方 的 面积 ) = 0.1056 
如 果 我 们 没有 进行 修正 , 结果 将 是 0.0764. 
解法 二 有 400 的 3% =12 个 次 品 .从 连续 的 角度 来 考虑 ,12 个 或 更 多 个 工具 就 是 11.5 个 或 更 多 个 . 
р = Np = 400x2% = 8 Н с = VNpg = V400 х 0.02 х 0.98 = 2.8 
则 11.5 的 标准 值 = (11.5 -8)/2.8= 1.25. |8] Е, 要求 的 概率 是 0.1056. 
(b) 


1.25 


(0.02 + 0.00125) 的 标准 值 = 2-02 + 0.00125 - 0.02 = 0.18 


要 求 的 概率 = ( 正 态 曲 线 下 z = 0.18 左 方 的 面积 ) 
= 0.5000 + 0.0714 = 0.5714 
如 果 我 们 没有 进行 修正 ,结果 将 是 0.5000. 也 可 用 (a) 中 解法 二 的 方法 . 
8.10 某 选 举 区 的 选举 结果 表明 某 一 位 候选 人 得 到 了 46% 的 选票 . 从 选民 中 随机 抽取 (a) 
200, (b) 1000 人 作 民 意 测 验 , 求 大 多 数 人 支持 这 位 候选 人 的 概率 . 


R T (а) yp=p=0.46 且 op= 20 = | 00:34 0.0352 


因为 1/(2N)=1/400=0.0025, 所 以 样本 中 的 大 多 数 即 指 支持 这 位 候选 人 的 选民 比例 为 0.50 
+0.0025 = 0. 5025 或 更 多 . (这 个 比例 也 可 这 样 求 得 :101 人 或 更 多 就 是 200 人 中 的 大 多 数 , 如 果 将 
其 视 为 连续 型 变量 就 是 100.5 人 ,因此 比例 是 100.5/200=0.5025.) 


_ _ 0.5025—0.46_ 
0.5025 的 标准 值 = oo = 1:21 


要 求 的 概率 = ( 正 态 曲线 下 z = 1.21 右 方 的 面积 ) 
= 0.5000 — 0.3869 = 0.1131 


-p= — [ра |0.46х0. 54 _ 
(b) пр=р= 0.46 Н op М 1000 0.0158 


_ _ 0.5005 – 0.46 _ 
0.5005 的 标准 值 = 0018 = 2:56 


要 求 的 概率 = ( 正 态 曲线 下 z = 2.56 右 方 的 面积 ) 
= 0.5000 — 0.4948 = 0.0052 


差 与 和 的 抽样 分 布 
8.11 变量 U, 表示 总 体 3, 7,8 中 的 任 一 元 素 , U, 表示 总 体 2,4 中 的 任 一 元 素 .计算 : (а) 


Hu? (Ы), (сир - U,’ (d) fy? (e)cu， (£) Ty 


- U, 
解 E (a) pu = 总 体 U 的 均值 = 工 (3+7+8)=6 
(b) wu = 总 体 И; 的 均值 = 十 (2+ 4) =3 
(с) 总 体 包括 Ui 中 的 任意 数 和 U, 中 的 任意 数 之 差 ， 
3-2 7-2 8-2 1 5 6 
3-4 7-4 8-4 或 -1 3 4 


则 
pu -u= Ui- U2) 的 均值 = HD ttg 

由 (a) 和 (b) 可 见 ,一 般 的 结果 为 Ар - u, 7 py, йш, 

2 _ _ (3-6)+(7-6)?+(8-6) 14 14 
(D оо = р 的 方 尖 -全 -人 +76 + (8-6 на, Па 

_ 312 — 

(е) о = 0, 的 方差 = CUY a г, 
(f) 


= 1. 


co р, = SECU, – U,) 的 方差 





1 3)2 5 (5 – 3)2 + (6 - 3)2 + (1 - 3): + (3 - 3)2 + (4-3)? 
= 6 
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Roy = ү F OMOTE ARRERA oy y= JA +, 

A 铝 牌 电灯 泡 的 平均 寿命 为 1400 小 时 , 标准 差 为 200 小 时 .B 品牌 电灯 泡 的 平均 寿命 
为 1200 小 时 , 标准 差 为 100 小 时 .从 每 个 品牌 中 随机 抽取 125 个 灯泡 检验 , 求 A 品牌 
灯泡 的 平均 寿命 比 召 品牌 灯泡 的 平均 寿命 至 少 多 (a) 160 小 时 , (b)250 小 时 的 概率 . 
解 SF 设 X4 和 Xp 分 别 表示 样本 A 和 B 的 平均 寿命 . 则 


МЎ -Rs 一 Их 一 х, = 1400 一 1200 = 200 小 时 
2 2 5 5 
2 < 5 ШШ ZA 十 ов = (100) + (200) Ка 20 小 时 
ХА-Хь Na Na 125 125 
均 信之 差 的 标准 化 变量 为 
бу g = 20 


很 接近 于 正 态 分 布 . 
(а) Æ 160 的 标准 值 是 (160- 200)/20= -2. 则 
要 求 的 概率 = (ЕЩ Т z = - 2 右 方 的 面积 ) 
= 0.5000 + 0.4772 = 0.9772 
(b) Æ 250 的 标准 值 是 (250 -~ 200)/20= 2.50. W 
要 求 的 概率 = ( 正 态 曲线 下 z = 2.50 右 方 的 面积 ) 
= 0.5000 - 0.4938 = 0.0062 
ПАНО НОК 0. 50 克 , 标准 差 为 0.02 т. 现 有 两 批 该 种 轴承 滚珠 各 1000 
个 , 求 两 批 轴承 滚珠 重量 之 差 多 于 2 克 的 概率 . 
解 F 设 X 和 于, 分 别 表示 两 批 轴承 重量 的 均值 则 


ИХ-Х, 一 “Хх, 一 FR, = 0.50 - 0.50 = 0 


„оа, _ у 49027 -+ 00.02) _ 0.000895 
охумур = ҮС 1000 1000 7S 
均值 之 差 的 标准 化 变量 为 
a (X, T Х,) ВУ 0 
z = 0.000895 
很 接近 于 正 态 分 布 . 


两 批 轴承 之 间 重 量 差 为 2 克 相 当 于 均值 差 为 2/1000 0.002 克 , 或 者 是 X, - Х,:>0.002, 或 者 
Æ X,- Х,< – 0.002, 8 


0.002 -0 20.0020. 
= 22 0.000895 = 2:23 = < чу D00895 


则 Р(2222.23 R z< -2.23) = Р(«;>2.23) + Р(2%< - 2.23) =2 х (0.5000 ~ 0.4871) = 0.0258. 

4 和 召 玩 “正面 和 反面 ”的 游戏 . АЛ 9 9-га т 50 次 ,如果 A 得 到 的 正面 次 数 比 
B 得 到 的 正面 次 数 多 5 或 更 多 , 则 A 获胜 , 否则 , В 获胜 . 求 在 任 一 场 游戏 中 A 不 获胜 
的 成 败 比 . 

Ж BF 用 Ps 和 P; 分别 表 示 A 和 B 得 到 正面 次 数 的 比例 .如 果 我 们 假定 硬币 是 均匀 的 , 则 出 现 
正面 的 概率 р 0 iA 





– 2.23 


В 
1 1 
2X х = 
_ f2 2 _ [ре р |) 2 2 _ 
Tp -P op, + op, Na КМ» = 50 = 0.10 


比例 之 差 的 标准 化 变量 为 z= (Ра ~ Pp 一 0)/0.10. 

从 连续 的 角度 来 考虑 ,$ 次 或 更 多 次 出 现 正面 即 指 4.5 次 或 更 多 次 出 现 正面 ,所 以 比例 之 差 应 为 
4.5/50= 0.09 或 更 多 ;也 就 是 说 , 子 大 于 或 等 于 (0.09 -0)/0.10=0.9( 或 z 宇 0.9). 这 一 概率 等 于 正 
态 曲 线 下 z =0.9 右 方 的 面积 , 即 为 (0.5000 -0.3159) = 0.1841. 

则 A 不 获胜 的 成 败 比 为 (1-0.1841):0.1841=0.8159:0.1841, 或 4.43:1. 


段 距离 测量 为 27.3 厘米 和 15.6 厘米 ,标准 差 ( 标 准 误差 ) 分 别 是 0.16 厘米 和 0.08 


厘米 . 求 两 段 距 离 的 (a) 和 (b) 差 的 均值 和 标准 差 


解 CF 如 果 两 段 距离 分 别 记 为 D1 和 D, W 
(а) Mp +p, =#p, +ир =27.3+15.6=42.9 ЖЖ 
p, = /op +0 = V (0.16)? + (0.08)? =0.18 厘米 
(b) ир кь -ap =27.3-15.6=11.7 EX | 
op -p, = | ah, tap, = V (0.16) + (0.08)? =0.18 ЖЖ 
ЖЕРЕН Р: йт у 1500 小 时 , 标准 差 为 150 小 时 .有 三 个 灯泡 串联 在 一 起 , 当 一 


个 灯泡 损坏 后 , 另 一 个 接着 使 用 .假设 灯泡 的 寿命 服从 正 态 分 布 , 求 三 个 灯泡 总 发 光 时 
加 满足 下 列 条 件 的 概率 ;(a) 至 少 5000 小 时 ,(b) 至 多 4200 小 时 . 


解 E 假设 灯泡 的 寿命 分 别 为 上 1, 工 , 和 工 ;. 则 
з, б tL, + н, = 1500 + 1500 + 1500 = 4500 小 时 


ЛЬ 21, + т, + а, = /3 х 150? = 260 小 时 
(а) 5000 的 标准 值 = 3000—4500 = 1.92 
要 求 的 概率 = ( 正 态 曲线 下 z = 1.92 右 方 的 面积 ) 
= 0.5000 — 0.4726 = 0.0274 
(b) 4200 的 标准 值 = 4200—4300 = ~ 1.15 


要 求 的 概率 = ( 正 态 曲线 下 z = - 1.15 左 方 的 面积 ) 
= 0.5000 — 0.3749 = 0.1251 


参考 习题 8.1, 求 样本 (a) 方差 抽样 分 布 的 均值 , (b) 样本 方差 抽样 分 布 的 标准 差 ( 即 样 
本 方差 的 标准 误差 ). 


E 8 (а) 对 应 于 习题 8.1 中 的 25 个 样本 的 样本 方差 是 


0 0.25 4.00 9.00 20.25 
0.25 0 2.25 6.25 16.00 
4.00 2.25 0 1.00 6.25 
9.00 6.25 1.00 0 2.25 
20.25 16.00 6.25 2.25 0 

样本 方差 抽样 分 布 的 均值 是 
2 _ 25 个 样本 的 样本 方差 之 和 135 _ 
з С 25 2 25 7240 


因为 N=2 且 =10.8( 见 习题 8.1(b)), 而 (N - 1). 2/№= $ x10.8=5.4, #0 1s =(М—-1)в?/ 
N. 


结 采 表明 有 必要 定义 一 个 修正 的 样本 方差 


- М 
2 2 
м-т 


则 有 ио zz2( 见 69 页 的 注释 ) .要 注意 的 是 总 体 方差 的 定义 同 前 , 只 有 样本 方差 需要 修正 . 
(b) 样本 方差 抽样 分 布 的 方差 等 于 用 上 表 中 的 每 个 数 减 去 均值 5. 40, 再 将 所 得 25 个 数 的 平方 和 除 
VA 25. о? = 575.75/25 = 23.03, 3È с: = 4.80. 








8.18 ”如 果 抽 样 是 无 放 回 的 ,求解 习题 8.17. 
解 F (а) 在 习题 8.17(a) 的 表 中 ,位 于 零 对 角 线 的 上 方 (或 下 方 ) 共 有 10 个 数字 给 出 了 10 个 样 
本 的 方差 . 则 
u2= 0.25 + 4.00 + 9.00 + 20.25 + 2.25 + 6.25 + 16.00 + 1.00 + 6.25 + 2.25 
s 10 
= 6.75 
这 是 一 般 结 果 
М, N-i 
А? = КЕ] N 1а 
的 一 个 特殊 情形 ,将 N,=5,N=2 和 og?=10.8 АЛ ЕЖ, 18 и = A x 2. х 10.8 = 6.75. 
(b) 将 习题 8.17(a) 的 表 中 的 位 于 零 对 角 线 上 方 的 10 个 数字 各 减 去 6.75， 所 得 结果 的 平方 和 除 以 
10, 可 得 022 = 39.675, 或 c:=6.30. 
8.19 ”一 大 群 学 生体 重 的 标准 差 为 10.0 磅 . 从 总 体 中 抽取 包含 有 200 名 学 生 的 样本 , 计算 体 
重 的 样本 标准 差 . 求 样本 标准 差 抽 样 分 布 的 (a) 均 值 , (Ь) 标准 差 . 
# EF 我 们 可 把 样本 看 作 是 从 无 限 总 体 中 抽取 或 从 有 限 总 体 中 有 放 回 地 抽取 得 到 的 .由 表 8.1, 
我 们 有 
(а) 伞 本 标准 差 抽样 分 布 的 均值 为 ww = o= 10.0 磅 . 
(b) 样本 标准 差 抽 样 分 布 的 标准 差 为 nc = c/V2N =10/ V400 = 0.50 8. 
8.20 ”在 习题 8.19 中 , 求 标准 差 满足 下 列 条 件 的 样本 的 百分比 .(a) 大 于 11.0 磅 , (b) 小 于 
8.8 磅 . 
МО S 样本 标准 差 抽 样 分 布 近似 于 均值 为 10.0 В, 方差 为 0.50 磅 的 正 态 分 布 . 
(а) 11.0 的 标准 值 是 (11.0- 10.0)/0.50=2.0. 正 态 曲 线 下 > =， 0 右 方 的 面积 是 0.5-0.4772 = 
0.0228, 则 要 求 的 百分比 是 2.3% . 
(b) 8.8 的 标准 值 是 (8.8 - 10.0)/0.50= -2.4. 正 态 曲线 下 > = -2.4 左 方 的 面积 是 0.$-0.4918 = 
0.0082, 则 要 求 的 百分比 是 0.8% . 
仆 充 习题 
均值 的 抽样 分 布 
8.21 一 个 总 体 包 含 4 个 数字 3,7,11 和 15. 考 察 从 中 有 放 回 地 抽取 出 的 所 有 容量 为 2 的 样本 . 求 (a) 总 体 均 


ЇЕ, (b) 总 体 标准 差 , (c) 样本 均值 抽样 分 布 的 均值 , (d) 样本 均值 抽样 分 布 的 标准 差 , 运 用 合适 的 公式 
由 (a) 和 (b) 验 证 (c) 和 (qd). 

如 果 抽 取 是 无 放 回 的 ,求解 习题 8.21. 

1500 个 轴承 滚珠 的 质量 服从 均值 为 22.40 克 , 标准 差 为 0.048 殉 的 正 态 分 布 .从 中 随机 抽取 300 个 容 
Е 2 36 的 样本 , 求 样本 均值 抽样 分 布 的 期 望 的 均值 和 标准 差 ， 如 果 (a) 抽取 是 有 放 回 的 , (b) 抽取 是 
无 放 回 的 . 

如 果 总 体 包含 有 72 个 轴承 滚珠 ,求解 习题 8.23. 

在 习题 8.23 中 , 有 多 少 个 随机 样本 的 均值 满足 下 列 条 件 ， (а) 在 22.39 克 和 22.41 克 之 间 ,(b) 大 于 
22.42 9, (c) 小 于 22.37 1, (d) 小 于 22 38 я К 22.4197. 

某 公司 生产 的 电子 管 的 平均 寿命 为 800 小 时 ， 标准 差 为 60 小 时 .从 中 随机 抽取 16 支 电 子 管 ， KHF 
均 寿 命 满 足下 列 条 件 的 概率 ;(a) 在 790 小 时 和 810 小 时 之 间 , (b) 小 于 785 小 时 , (с) 大 于 820 小 时 ， 
(9) 在 770 小 时 和 830 小 时 之 间 ， 


8.27 
8.28 


如 果 从 总 体 中 抽取 了 64 文 电 子 管 , 求 解 习题 8.26. 并 解释 两 题 的 区 别 . 
某 百 货 商 店 收 到 的 包 娟 重量 的 均值 为 300 磅 ,标准 差 为 50 磅 ,如 果 电 梯 的 安全 极限 为 8200 磅 , 求 随 
机 收 到 的 25 个 包 灌 放 入 电梯 超重 的 概率 . 


随机 数 表 


8.33 


有 放 回 地 选取 (a) 15, (Ь) 30, (с) 45, (4) 60 个 容量 为 4 的 样本 ,用 另 一 组 随机 数 求解 习题 8.6, 并 比较 
每 -种 情形 中 的 理论 上 的 结果 . 

如 果 有 放 回 抽取 的 样本 容量 不 是 4, 而 是 (а) 2, (Ъ) 8, 求 解 习题 8.29. 

如 果 抽 样 是 无 放 回 地 ,求解 习题 8.6, 并 和 理论 上 的 结果 相 比 较 . 

(а) 说 明 如 何 从 习题 3.61 的 分 布 中 选取 30 个 容量 为 2 的 样本 . 

(b) 求 样本 均值 的 抽样 分 布 的 均值 和 标准 差 , 并 和 理论 上 的 结果 相 比 较 . 

如 果 样 本 容量 为 д, 求解 习题 8.32. 


比例 的 抽样 分 布 


8.34 


8.39 


假定 男孩 和 女孩 出 生 的 概率 相等 ,在 200 个 将 要 出 生 的 孩子 中 , 求 下 列 事件 发 生 的 概率 ,(a) 男孩 少 于 
40% , (b) 女孩 在 43% 和 57% 2 |8], (с) 男孩 多 于 54%. 

在 1000 个 各 有 200 个 孩子 的 样本 中 , 预计 能 找到 多 少 个 样本 满足 下 列 条 件 ? (ау 男孩 少 于 40% , (b) 
KE 40% 和 60% 28], (с) 女孩 不 少 于 53%. 

如 果 每 个 样本 含有 100 个 孩子 ,求解 习题 8.34, 并 解释 两 题 结果 的 差别 . 

РТ 80 个 球 , 其 中 60% 是 红色 的 ,40% 是 白色 的 .从 铅 子 中 有 放 回 地 抽取 50 个 含有 20 个 球 
的 样本 , 预计 有 多 少 个 样本 含有 (a) 等 量 的 红 球 和 白 球 , (b) 12 个 红 球 和 8 TARR, (с) 8 个 红 球 和 12 
个 日 球 , (d) 10 个 或 更 多 的 白 球 ? 

设计 一 个 试验 验证 习题 8.37 的 结果 .你 可 以 按 正 确 的 比例 用 写 有 尺 和 Ww 的 纸 条 分 别 代 替 红 球 和 白 
球 . 知 用 两 种 不 同 的 硬币 代替 球 会 引起 什么 样 的 误差 ， 

某 工厂 生产 1000 批 灯泡 , 每 批 100 个 .如 果 灯 泡 中 有 5% 是 次 品 ， 则 预计 能 有 多 少 批 灯 泡 满足 (a) E 
mD F 90 个 , (b) 正品 不 少 于 98 个 ? 


差 与 和 的 抽样 分 布 


8.40 


8.41 
8.42 


A 和 8B 两 种 品牌 电缆 的 拉 断 力 均值 分 别 为 4000 磅 和 4500 磅 , 标准 差分 别 为 300 磅 和 200 磅 .检验 А 
品牌 的 100 条 电缆 和 B 品牌 的 50 Жї, Ж В 品牌 电缆 的 拉 断 力 均值 满足 下 列 条 件 的 概率 ;(a) 至 
少 比 A 的 大 600 傍 , (b) 至 少 比 А 的 大 450 ЁЁ. 

如 果 两 种 品牌 的 电缆 都 检验 100 条 ,求解 习题 8.40, 并 解释 两 题 的 区 别 ， 

在 一 次 智力 测验 中 ,学 生 的 均 分 是 72 分 ,标准 差 是 8 分 . 有 两 组 学 生 名 有 28 АЖ 36 人 , 求 它 们 均 分 
之 差 满 足下 列 条 件 的 概率 :(a) 不 小 于 3 分 , (b) 不 小 于 6 分 , (с) 在 2 分 和 5 分 之 间 . 

一 个 访 子 中 有 60 个 红 球 和 40 个 白 球 .从 中 有 放 回 地 抽取 两 组 球 ,每 组 30 个 ,并 记 下 它们 的 颜色 . 求 
两 组 球 中 的 红 球 数 之 差 不 小 于 8 的 概率 . 

如 果 抽 取 每 组 球 时 , 抽取 都 是 无 放 回 的 ,求解 习题 8.43. 

某 选举 区 选举 结果 表明 菜 位 候选 人 获得 了 65% 的 选票 ， 随机 抽取 两 组 样本 , 每 组 含有 200 名 选民 , 求 两 
组 样本 中 支持 这 位 候选 人 的 选民 比例 之 差 大 于 10% 的 概率 . 

如 果 U, 和 U, 是 习题 8.11 中 的 两 组 数字 , 证 明 ; (а) ш, ， Жш: 


(b) 7y +U, / ov + oo 

测 得 3 个 物体 的 重量 分 别 为 20.48 克 , 35.97 克 和 62 34 w, 标准 差分 别 为 0.21 克 ,0.46 克 和 0.54 
死 . 求 重量 之 和 的 (a) 均值 , (b) 标准 差 . 

一 市 电池 的 平均 电压 是 15.0 伏 , 标准 差 是 0 2 供 . 求 四 节 这 样 的 电池 串联 后 总 电压 不 小 于 60 8 伏 的 
概率 . 


十 
U, р, 


含有 7 个 数字 的 总 体 的 均值 是 40, 标准 差 是 3. 从 总 体 中 随机 抽取 容量 为 5 的 样本 , 求 样本 方差 抽样 分 


8.51 


8.52 


布 的 均值 , 如 果 (a) 抽取 有 放 回 , (b) 抽取 无 放 回 . 

某 公司 生产 的 电子 管 的 平均 寿命 是 900 小 时 , 标准 差 是 80 小 时 .该 公司 生产 了 1000 批 电 子 管 , 每 批 
有 100 个 .预计 能 有 多 少 批 产品 满足 (a) 平均 寿命 超过 910 小 时 ，(b) 寿命 的 标准 差 超过 95 小 时 ” 必 
须要 作出 何 种 假设 ? 

如 果 习 题 8.50 中 寿命 的 中 位 数 是 900 小 时 ,预计 能 有 多少 批 产品 的 寿命 的 中 位 数 超过 910 小 时 ? 和 
习题 8. S0(a) 中 的 答案 相 比 较 并 解释 结 

某 次 测验 成 绩 服从 均值 为 72 分 ,方差 为 8 分 的 正 态 分 布 .(a) 求 得 分 在 前 20% 的 学 生 的 最 低 分 ,(b) 
随机 抽取 100 名 学 生 , 求 得 分 在 前 20% 的 学 生 的 最 低 分 小 于 76 的 概率 . 


Жл. 统计 估计 理论 


参数 的 估计 


在 上 一 章 , 我 们 了 解 到 如 何 应 用 抽样 理论 来 获取 从 已 知 总 体 中 随机 抽取 得 到 的 样本 的 信 
时 .但 是 从 实用 的 角度 来 看 , 如 何 通过 抽取 的 样本 来 推 新 有 关 总 体 的 信息 才 是 更 重要 的 .统计 
推断 处 理 的 就 是 这 类 问题 ,其 中 要 用 到 抽样 理论 的 一 些 准则 . 

统计 推断 中 的 一 个 重要 问题 是 根据 样本 统计 量 或 简称 统计 量 ( 如 样本 均值 和 方差 ) 得 到 相 
应 的 总 体 参 数 或 简称 参数 (如 总 体 均 值 和 方差 ) 的 估计 .本 章 就 要 讨论 这 一 问题 . 


无 偏 估计 


如 林 一 个 统计 量 的 抽样 分 布 的 均值 等 于 相应 的 总 体 参数 ,那么 这 个 统计 量 就 是 此 参数 的 
一 个 无 候 估 计量 ; 否则 , 就 称 为 有 偏 估计 量 . 统 计量 的 相应 值 分 别称 为 无 偏 估计 或 有 偏 估计 . 佑 
计量 也 常 简称 为 估计 . 

例 1 样本 均值 抽样 分 布 的 均值 ys 等 于 总 体 的 均值 jy, 则 样本 均值 X 是 总 体 均值 j 的 一 
个 无 偏 估计 . 


例 样本 方差 抽样 分 布 的 均值 为 y= o, 其 中 o? 是 总 体 方差 ,N 是 样本 的 容量 


( 见 表 8.1), 则 样本 方差 * 是 总 体 方差 o 的 一 个 有 偏 估计 . 对 于 修正 的 样本 方差 


о _N ， 
б = туз 


因为 ue=0°, IA 52 ЖЕ с? 的 无 偏 合计. 但是,; 是 c 的 有 偏 估计 . 
也 可 改 用 术语 期 望 ( 见 第 六 章 ) 来 叙述 :如 果 一 个 统计 量 的 期 望 等 于 相应 的 总 体 参 数 , 则 此 统计 
量 是 无 偏 的 .由 于 Е(Х)=,,Е(?)=в?,1Ж XAS 是 无 偏 的 . 


有 效 估计 


如 琳 两 个 统计 量 的 抽样 分 布 有 相同 的 均值 (或 期 望 ), 那么 方差 较 小 的 那个 统计 量 称 为 此 
均值 的 有 效 估计 量 , 男 一 个 称 为 无 效 估计 量 .统计 量 的 相应 值 称 为 有 效 估计 或 无 效 估计 . 

在 均值 的 所 有 无 偏 估计 量 中 , 方差 最 小 的 那个 统计 量 常 被 称 为 此 均值 的 最 有 效 估计 量 或 
最 优 估 计量 . 

例 3 样本 均值 和 中 位 数 的 抽样 分 布 有 相同 的 均值 , 都 为 总 体 均值 .但 是 ,样本 均值 抽样 
分 布 的 方差 要 小 于 中 位 数 抽样 分 布 的 方差 ( 见 表 8.1). 因 此 两 者 相 比 较 , 样本 均值 是 总 体 均 值 
的 有 效 估计 ,而 样本 中 位 数 是 无 效 估 计 . 

在 总 体 均 值 的 所 有 线性 估计 量 中, 样本 均值 是 最 有 效 (或 最 优 ) 估 计量 ， 

在 实际 问题 中 , 常常 要 用 到 无 效 估计 ,因为 它们 有 时 计算 起 来 相对 较为 简便 . 


点 估计 和 区 间 估 计 








如 采用 一 个 数 来 估计 总 体 的 参数 , 那么 这 种 估计 叫做 参数 的 点 估计 .如果 给 出 两 个 数 , 指 
出 参数 位 于 其 间 , 那么 这 种 估计 叫做 参数 的 区 间 估 计 . 

区 间 估 计 更 加 精确 , 因而 要 优 于 点 估计 . 

例 4 如 果 我 们 说 测量 的 一 段 距 离 是 5.28 Ж, 我 们 就 给 出 了 一 个 点 估计 .但 如 果 我 们 说 这 段 
距离 是 5.28 米 +0.3 米 ( 即 距离 在 5.25 ЖАП 5.31 米 之 间 ), 我 们 就 给 出 了 一 个 区 间 估 计 . 


总 体 参数 的 置信 区 间 估 计 


用 us 和 cs 分 别 表示 统计 量 S 的 均值 和 标准 差 . 如 果 S 的 抽样 分 布 是 近似 正 态 的 ( 当 样 
本 容量 №2230 时 对 于 许多 统计 量 都 成 立 ), 则 实际 的 一 个 样本 统计 量 S 位 于 区 间 (Hus - os, us 
+ 065), (иѕ – 205, ys +20s) 和 (js 一 30s, ys +30s) 的 可 能 性 大 约 分 别 为 68.27% ,95.45% 和 
99.73%. 

同样 地 ,我 们 在 区 间 (S — os, 5 + 05), (5 – 205, S + 205) 1(5 – 305, 5 + 305) HHE] ws 
的 可 能 性 大 约 分 别 为 68.27%, 95. 45% 和 99. 73%. AE, 我 们 分 别称 这 些 区 间 为 ws 的 
68.27% ,95.45% 和 99.73% 的 置信 区 间 . 这 些 区 间 的 端点 值 (S+cs,S+2cs 和 St+3cs) 则 称 
为 68.27%,95.4$% 和 99.73% 的 置信 界限 或 置信 限 . 

类 似 地 , 5 + 1.9605 和 S+2.58os 是 ps 的 95% 和 99% (0.95 或 0.99) 的 置信 界限 .其 中 ， 
百分数 叫做 置信 水 平 ,数字 1.96,2.S8 等 叫做 临界 值 , 记 为 >. .由 置信 水 平 我 们 能 找到 临界 
值 ,反之 亦 然 . 

表 9.1 给 出 了 对 应 于 不 同 置信 水 平 的 常用 的 临界 值 x. 对 于 表 中 未 列 出 的 置信 水 平 . 相 
应 的 z. 值 可 由 正 态 曲 线 面积 表 ( 见 附录 工 ) 求 得 . 


表 9.1 


P в% | oo% [osasu] osu | son | вож [бля 






均值 的 置信 区 间 


如 采 统 计量 S 指 的 是 样本 均值 X, 则 估计 总 体 均值 u 的 95% ЯП 99% 的 置信 限 分 别 为 到 + 
1.96oz 和 X+2.58oxf. 更 一 般 地 ,置信 限 为 六 + «оу, EP а (依赖 于 不 同 的 置信 水 平 ) 可 由 表 
9.1 查 得 .代入 第 八 章 中 所 求 得 的 ox, 如 果 总 体 是 无 限 的 或 总 体 有 限 但 抽取 是 有 放 回 的 , 则 总 
体 均 值 的 置信 限 为 

Х + Ze Ta (1) 
如 采 抽 取 是 无 放 回 的 且 总 体 容 量 N, 有 限 , 则 总 体 均值 的 置信 限 为 


o |№- М 
ИГ М, —1 (2) 


一 般 说 来 ,总 体 的 标准 差 ec 是 未 知 的 ,要 得 到 上 述 置 信 限 , 可 用 o KAES 或 ， RE о. 当 
№230 时 ,效果 较 好 些 . 当 N<30 时 ,近似 性 较 差 , 就 要 用 到 小 样本 抽样 理论 ( 见 第 十 一 音 ). 


比例 的 置信 区 a] 


2 


Хож 


ЖЖЖИ S 指 的 是 从 一 个 服从 二 项 分 布 且 成 功 的 比例 ( 即 成 功 的 概率 ) 是 p 的 总 体 中 
抽取 的 容量 为 N 的 样本 的 成 功 比例 P, 则 p 的 置信 限 是 P+ zop. 代 入 第 八 章 中 求 得 的 ср, 如 
采 总 体 是 无 限 的 或 总 体 有 限 但 抽取 是 有 放 回 的 , 则 总 体 比例 的 置信 限 为 


Раа. |00 Pir, РЧ) (3) 


如 果 抽 取 是 无 放 回 的 且 总 体 容量 N, 有 限 , 则 总 体 比 例 的 置信 限 为 


М„-М 
p+ 2, |24 Ба" (4) 


为 了 计算 出 置信 限 , 我 们 要 用 Р ЖЇД р, 当 №230 时 ,效果 较 好 些 . 习 题 9.12 中 给 出 了 
一 个 求 得 置信 限 的 更 精确 的 方法 . 


差 与 和 的 置信 区 间 


ШЖ Si 和 Ss 是 抽样 分 布 近似 正 态 的 两 个 样本 统计 量 且 样本 是 独立 的 ( 见 第 八 章 ), 则 对 
应 于 Si 和 S: 的 总 体 人 参数 之 差 的 置信 限 为 


Si -St+zas ss=SI-S+zx fos +оу (5) 
而 总 体 参 数 之 和 的 置信 上 限 为 
2 2 
5+5, + #05 45 = 51 + 55 + х, os + oS, (6) 
例如 ,如果 总 体 是 无 限 的 ,两 个 总 体 均值 之 差 的 置信 限 为 

2 2 
у ү у o vy 01, 02 
Хі Х E хоу у = Xi 一 Xa + х, м, М, (7) 


其 中 Хот, Ni Хо, ог, Na 分 别 表示 从 总 体 中 抽取 的 两 个 样本 的 均值 .总 体 标准 差 和 样本 
容量 
类 似 地 , 如 果 总 体 是 无 限 的 , 两 个 总 体 比例 之 差 的 置信 限 为 


o 
Pd р) p0 o- p) 
pm (8) 


其 中 Р, 和 Pi 表示 两 个 样本 的 比例 , N 和 №, 表示 从 总 体 中 抽取 的 两 个 样本 的 容量 ， pı 和 
р 表示 两 个 总 体 的 比例 (用 Р, 和 P, Б). 


标准 差 的 置信 区 间 
服从 正 态 分 布 的 总 体 的 标准 差 o 是 用 样本 的 标准 差 估计 的 , 由 表 8.1, 它 的 置信 限 为 





2 аб, = з Ж а= (9) 
为 求 得 置信 跟 ， 用 $ 或 $ Wito. 
可 能 误差 
对 应 于 统计 量 S 的 总 体 参数 的 S0% 置 信 限 为 St0.674560,. 称 0 674505 为 估计 的 可 能 
RE. 
习题 及 解答 
无 偏 估计 与 有 效 估计 


9.1 给 出 满足 下 列 条 件 的 估计 量 的 例子 :(a) ЖИЙН ЖЖ, (Ь) 无 偏 但 无 效 , (с) 有 偏 且 无 效 . 
解 E (a) 样本 均值 XX 和 修正 的 样本 方差 


2 -N ;2 
N-1 





$ 
分 别 是 总 体 均 值 和 方差 是 满足 条 件 的 估计 量 . 


(D) 样本 中 位 数 和 样本 统计 量子 ( Q + Qs) 是 满足 条 件 的 两 个 例子 .其 中 О, 和 О, 分 别 是 样本 的 第 1 


个 四 分 位 数 和 第 3 个 四 分 位 数 .因为 这 两 个 统计 其 的 抽样 分 布 的 均值 都 等 于 总 体 的 均值, 所 以 它们 者 
是 总 体 均值 的 无 偏 估 计 . 
(с) 样本 标准 差 ,修正 后 的 样本 标准 差 ,平均 偏差 和 半 内 四 分 距 是 满足 条 件 的 总 体 标准 差 的 四 个 全 
计量 . 

9.2 一 个 样本 包含 了 某 位 科学 家 测量 到 的 一 个 球体 直径 的 5 次 记录 :6. 33, 6. 37, 6. 36, 6.32 
和 6.37 厘米 . 求 (a) 真实 均值 , (b) 真实 方差 的 无 偏 是 有 效 的 估计 


E F (а) 真实 均值 ( 即 总 体 均值 ) 的 无 偏 且 有 效 的 估计 为 


— ‚3 


(b) 真实 方差 ( 即 总 体 方差 ) 的 无 偏 且 有 效 的 估计 为 





2 + (6.37 — 6.35) + (6.36 — 6.35} + (6.32 - 6.35) + (6.37 – 6.35) 
5-1 





= 0.00055 厘米 ? 
注意 ,即使 ?= V0.00055 = 0.023 厘米 是 真实 标准 差 的 一 个 估计 ,但 既 不 是 无 偏 的 也 不 是 有 效 的 . 
9.3 假设 XYZ 大 学 里 100 名 男生 的 身高 是 这 所 大 学 1546 名 男生 身高 的 一 个 随机 样本 . 求 
(а) 真实 均值 ，(b) 真实 方差 的 元 偏 且 有 效 的 估计 . 
解 EF (а) 由 习题 3.22, 真 实 均值 的 无 偏 且 有 效 的 估计 为 Х =67.45 英寸. 


(b) 由 习题 4.17, 真实 方差 的 无 偏 且 有 效 的 估计 为 


2_ _М_о› _ 100 
б =g sT од X 8.5275 = 8.6136 


Д] з= V 8.6136 =2.93 英寸 .注意 ,因为 N 很 大 ,所 以 s? 和 如 或 ;和 s 在 本 质 上 没有 什么 区 别 . 
注意 , 我们 并 没有 用 到 Sheppard 的 修正 方法 , 车 要 考虑 到 这 一 因素 ,应 有 s = 2.79 英寸 (见习 题 
4,21). 
9.4 给 出 习题 9.2 中 球体 直径 真实 均值 的 一 个 无 偏 但 无 效 的 估计 . 
# EF 中 位 数 是 总 体 均 值 的 一 个 无 偏 但 无 效 的 估计 .将 五 个 测量 值 按 大 小 排列 .中 位 数 是 6.36 E 
Ж. 


均值 的 置信 区 间 


9.5 求 习题 9.3 中 男生 平均 身高 的 (a) 95%, (Ь) 99% 的 置信 区 间 . 

解 F (а) 95% 的 置信 限 是 X+1.96o/VN. 由 X=67.45 及 :=2.93 作为 a 的 估计 (见习 题 9.3)， 
置信 限 为 67.45+ 上 1.96x(2.93/ V100) 或 67.45+0.57. 因 此 ,总 体 均值 u 的 95% 的 置信 区 间 是 66.88 
英寸 到 68.02 英寸 , 记 散 66.88< „< 68.02. 

下 到 我 们 可 以 说 总 体 的 平均 身高 在 66.88 英寸 和 68.02 英寸 之 间 的 概率 大 约 为 95% 或 0.95. 可 
记 为 P(66.88<p< 68.02)=0.95. 这 就 相当 于 说 我 们 有 95% 的 把 握 断 定 总 体 均值 或 真实 均值 在 
66.881: F ЖП 68.02 英寸 之 间 . 
(b) 99% 的 置信 限 是 X +2.580//N = X + 2.585// М =67.45+2.58 х (2.93/ V100) = 67.45 + 
0.76. 因 此 ,总 体 均值 р 的 99% 的 置信 区 间 是 66.69 英寸 到 68.21 英寸 , 记 做 6б.69<,н<68.21. 

为 了 得 到 上 述 置信 区 间 , 我 们 假定 总 体 是 无 限 的 或 总 体 很 大 , 这 可 以 和 有 放 回 抽样 等 同 考 虑 . 对 于 


有 限 总 体 , 若 抽样 是 无 放 回 的 , 则 用 
с N,- № a 
T | М1 | 代替 7 


= (1546100 
y Үт = 1546-1 ~ 0-967 
看 成 1.0, 因此 并 不 需要 作 替 换 . Жош Ей, НИИ 67.45 +0. 56 英寸 和 67. 45 + 


0.73 英 寸 . 

9.6 某 农 场 有 5000 棵 树 有 待 砍伐 .从 中 随机 选择 100 柠 树 并 记 下 它们 的 高 度 . 以 英寸 为 单位 
的 高 度 列 在 表 9.2 中 .用 Minitab 建立 5000 棵 树 平均 高 度 的 95% 置 信 区 间 . 如 果 每 英尺 
树 可 卖 2.40 美元 ,给 出 5000 Же ШГЕК КЕ. 
解 S 下 面 用 Minitab 给 出 的 置信 区 间 表 明 5000 棵 树 的 平均 高 度 最 低 可 达 57.24 英寸 ,最 高 可 达 
61.20 英寸 . 则 5000 标 树 的 总 长 度 在 57.24 х 5 000 = 286 200 英寸 和 61.20 x5 000=306 000 英寸 之 





但 是 ,我 们 可 将 


їн]. ш ЖЕ ЙЕ 2.40 美元 , 则 每 英寸 可 卖 0.2 美元 .所 以 5000 棵 树 的 价格 以 95% 的 置信 水 平 
在 286000x0.2=57 200 美元 和 306000 x0.2= 61200 美元 之 问 . 








表 9.2 
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Data Display 

height 
56 70 53 71 73 50 46 54 44 
48 61 61 48 53 62 57 61 73 


74 65 45 57 48 71 69 69 44 


73 
MTB > standard deviation cl 
Column Standard Deviation 
Standard Deviation of height =10.111 
MTB > zinterval 95 percent confidence sd =10.111data in с] 
Confidence Intervals 
The assumed sigma = 10.1 
Variable N Mean StDev SE Mean 95.0% CI 
Height 100 59.22 10.11 1.01 (57.24,61.20) 


9.7 现 对 一 些 天 主教 神父 作 调查 ， 每 位 神父 要 上 报 在 过 去 的 一 年 里 所 主持 的 洗礼 ,婚礼 和 丧 
礼 的 总 次 数 .有 关 数 据 列 在 表 9.3 中 .用 这 些 数据 为 过 去 一 年 里 平均 每 位 神父 主持 的 洗 
礼 \ 婚 礼 和 丧礼 的 总 次 数 w 建立 95% 的 置信 区 间 . 用 置信 区 间 公 式 和 Minitab 的 Zinter- 
val 命令 建立 区 间 . 


9.8 


9.9 





М EF 先 将 表 9.3 中 的 数据 输入 到 Minitab 工作 页 面 的 第 1 17, 并 为 其 命名 为 ‘number .然后 输入 


standard deviation 命令 . 
МТВ > mean сі 
Column Mean 
Mean of Number = 40.261 
МТВ > standard deviation с] 
Column Standard Deviation 
Standard deviation of Number = 9.9895 
均值 的 标准 误差 等 于 9. 9895/ V50 = 1.413, 临界 值 是 1. 96, 误差 的 95% 边界 是 1.96 x 1.413 = 
2.769. 所 以 置信 区 间 为 40.261 -2.769=37.492 到 40.261 + 2.769 = 43.030. 
输入 Zinterval 命令 得 到 如 下 的 结果 : 


-MTB> Zinterval 95% confidence sd = 9.9895 data in cl 


Zconfidence Intervals 

The assumed sigma = 9.99 

Variable N Mean StDev SE Mean 95.00% CI 

Number 50 40.26 9.99 1.41 (37.49, 43.03) 

我 们 可 以 有 95% 的 把 握 确 定 所 有 神父 主持 次 数 的 真实 均值 在 37.49 和 43.03 2 18]. 


生理 学 家 在 测量 反应 时 间 时 ,估计 的 标准 差 是 0.05 秒 .为 了 有 (a) 95%, (b) 99% 的 把 握 
保证 估计 误差 不 超过 0.01 秒 , 他 必须 要 抽取 多 大 的 样本 ? 
解 F (a) 95% 的 置信 和 限 是 X+1.96o/VN, 估计 误 差 是 1.96o/VN. 令 go=0.05, ШЖ 1.96 x 
0.05/ VN = 0.01, 那么 误差 等 于 0.01, 即 VN =1.96x0.05/0.01=9.8 或 N=96.04. 因 此 ,我 们 可 以 
有 95% 的 把 握 确定 :如果 NN 为 97 或 更 大 , 则 估计 的 误差 小 于 0.01 #7. 
另 解 ” 若 有 
VN 、_1 1.96 x 0.05 
1.96 x 0.05 = 0.01 或 VN 之 0.01 = 9.8 
ЙІ] 
1.96 х 0.05 

Л < 0.01 
所 以 №2296.04 或 №2297. 
(b) 99% 的 置信 限 是 XX+2.58o/VN, 则 2.58x0.05/VN ==0.01 或 N=166.4. 因 此 ,我 们 可 以 有 
99% 的 把 握 确 定 :只 有 当 NN 为 167 或 更 大 时 ,估计 的 误差 才 会 小 于 0.01 Ф. 
从 200 名 学 生 中 随机 抽取 的 50 名 学 生 的 数学 平均 分 为 75 分 ,标准 差 为 10 分 . 
(а) 200 名 学 生 数 学 平均 分 的 95% 的 置信 限 是 多 少 ? 
(b) 我 们 可 以 在 多 大 置信 水 平 上 说 200 名 学 生 的 平均 分 是 75+1? 
解 S (а) 因为 总 体 容量 相对 于 样本 容量 来 说 并 不 是 很 大 , 所 以 我 们 必须 要 作 些 调整 . 则 ос 的 署 
信 限 为 





X *1.96оу = X 1.96 A 2 75+ 1,96 0. W0 50 _ 
оў КЕ: = 75 1.96 76 00 р = 75+ 2.4 


(b) 置信 跟 可 表示 为 


T 二 o INN i0 [200-50 _ + 
X togata №, 21 = 75 + ғ, 750 20021 75 + 1.23, 


而 它 必 须 等 于 75+1, 则 1.23zx.=1 或 =0.81. ESH F z=0 ЯП = = 00.81 2 (АТТ 0.2910, 
因此 要 求 的 置信 水 平 为 2x0.2910=0.582 或 58.2%. 


比例 的 置信 区 间 


9.10 


对 茶 一 选举 区 内 随机 抽取 的 100 位 选民 的 民意 调查 表明 他 们 中 的 55% 支 持 某 位 候选 
人 . 求 所 有 选民 中 支持 这 位 候选 人 的 比例 的 (a) 95%, (Ь) 99%, (с) 99.73% 的 置信 限 . 
МО F 总 体 比 例 p 的 95% 的 置信 和 限 为 Pt1.96op=P+1.96 /Р(1- РУ/М =0.55 + 1.96 
V0.55 Xx0.45/100 =0.55+0.10, 其 中 我 们 用 样本 比例 已 来 估计 p. 

(b) р 的 99% 的 置信 和 限 为 0.55+2.58 /0.55%0.45/100=0.55 0.132. 

(с) p 的 99.73% ERRA 0.55+3 V0.55Xx0.45/100=0.55+0.15. 

习题 9.12 提供 了 一 个 更 为 精确 的 方法 . 

在 习题 9.10 中 ,为 了 能 有 (a) 95%, (Ь) 99.73% 的 把 握 确 定 那 位 候选 人 必定 当选 ,要 
从 选民 中 抽取 多 大 的 样本 ? 

解 上 zp 的 置信 限 为 P+z Vp(1~p)/N=0.55+ z, /0.55x0.45/N=0.55+0.50z.//N, 8] 
习题 9.10, 其 中 用 到 P= p=0.55. 因 为 只 有 候选 人 获得 了 50% 以 上 的 选票 才能 当选 , 所 以 必须 要 使 
0.50z./VN 小 于 0.05. 

(а) 对 于 95% 的 置信 水 平 ,0.50z./VN =0.50x1.96//N =0.05, N=384.2. 则 NN 至 少 为 385. 

(b) 对 于 99.73% 的 置信 水 平 ,0.50z./VN=0.50x3/V 六 =0.05,N=900. 则 N 至 少 为 901. 

另 解 S 当 VN/1.50>1/0.05 或 VN >1.50/0.05 时 ,1.50/VN <0.05. 此 时 VN >30 # N> 
900, 因 此 N 至 少 为 901. 

(а) ШЖ P 是 在 容量 为 N 的 样本 中 观测 到 的 成 功 比 例 .证 明 ; 在 由 > 决定 的 置信 水 平 
上 估计 总 体 成 功 比例 的 置信 限 为 











2 Р(1- Р) z? 

P +; Жа, N t алу? 
р = z2 
l+y 


(b) 用 (a) 中 得 到 的 公式 求 习题 9. 10 中 的 99.73% 的 置信 和 限 . 

(с) 证 明 : 当 很 大 时 ，(a) 中 的 公式 变 为 习题 9. 10 中 所 用 的 р=Р+ 
z. УР(1-Р)/М. 

解 EF (а) 样本 比例 已 的 标准 化 变量 为 


Р-р Р-р 
бр vpl- р)/М 


这 一 标准 化 变量 的 最 大 值 和 最 小 值 是 + z,, 其 中 2, 决定 了 置信 水 平 . 让 上 式 左 端 等 于 + ,我 们 有 


Р-р=+ =. рч) 


2 — 
Р? -2рР + p? = ZPUE) p) 


将 两 边 平方 


MAARA N 并 化 简 , 得 
(М + 22) р? - (2NP + «?)р + МР? -0 
га=М+&,Ь=—(2МР+?)Ң c= МР? 这 个 方程 变 为 ap?+ bp +c=0, 将 tp 看 作 未 知 数 , 它 的 解 


-bt уь -4ac 2NP+ ze + /(2МР + «?)?-4(М + «?у. NP 
一 = 


2а 2(М + =?) 


ж Ф 


2МР + &? + х, 4МР(1- Р) + z’ 


2( N + 22) 
分 子 和 分 母 同 除 以 2N, 变 为 


z? 
2М^*®*{ мМ а 
2; 


1+ 和 


(b) 对 于 99.73% 的 置信 限 , z. =3. 将 P=0.55 和 N=100 代入 (a) 中 的 公式 ,得 р =0.40 和 0.69, 和 
习题 9.10(a) 中 的 结果 一 致 . 

(с) 如 果 N 很 大 ,那么 z2/(2N),z?/(4N?) 和 z2/N 都 很 小 ,可 忽略 不 计 , 因而 也 可 用 零 代替. 由 此 就 
可 得 要 求 的 结果 . 

MIE ВСВ т 40 次 , 有 24 次 出 现 正面 .无 限 次 抛 毛 硬币 , 求 正面 出 现 比 例 的 (a) 95%, 
(b) 99.73% 的 置信 限 . 

解 е (а) 在 95% 的 置信 水 平 上 , zx-=1.96. 将 已 =24/40=0.6 和 N=40 代 入 习题 9.12(a) 中 的 
公式 ,得 p=0.45 和 0.74. 因 此 我 们 可 有 95% 的 把 握 认 为 p 在 0.45 和 0.74 之 间 . 

由 近似 公式 p= Р =, VP(1-P)/N 得 p=0.60+0.15, 由 此 得 到 的 区 间 为 0.45 到 0.75. 

(b) 在 99.73% 的 水 平 上 , 2 = 3. 由 习题 9.12(a) 中 的 公式 ,得 p=0.37 和 0.79. 

由 近似 公式 p= Р, VP(1-P)/N 得 p=0.60+0.23, 由 此 得 到 的 区 间 为 0.37 到 0.83. 


差 与 和 的 置信 区 间 
9.14 150 个 A 品牌 灯泡 的 平均 寿命 为 1400 小 时 , 标准 差 为 120 小 时 .200 个 B 品牌 灯泡 的 


平均 寿命 为 1200 小 时 ,标准 差 为 80 小 时 . 求 A 和 B 两 种 品牌 灯泡 平均 寿命 之 差 的 (a) 
95%, (Ь) 99% 的 置信 限 . 


解 ES A 和 日 两 种 品牌 灯泡 平均 寿命 之 差 的 置信 限 为 


X, - Хв + ze Vaa/NA + с5/ № 
(а) 95% 的 置信 限 是 1400 — 1200 — 1.96 V 120°/150 + 802/100 = 200 + 24.8. EE RIIFI Æ 95% K 
把 握 断定 总 体 均 值 之 差 在 175 小 时 和 225 小 时 之 间 . 
(b) 99% 的 置信 限 是 1400 -1200 = 2. 58 V 1202/150+ 8027100 = 200 土 32.6. 因 此 我 们 可 以 有 99% 的 
把 握 断定 总 体 均值 之 差 在 167 小 时 和 233 小 时 之 间 . 
从 收看 某 电视 节目 的 观众 中 随机 选择 了 400 名 成 年 人 和 600 名 青年 人 作 调 查 . 其 中 有 
100 名 成 年 人 和 300 名 青年 人 表示 喜爱 此 节目 . 求 在 所 有 收看 此 节目 的 观众 中 , 成 年 人 
和 育 年 人 膏 爱 此 节目 的 人 数 比 例 之 差 的 (a) 95%, (Ь) 99% 的 置信 限 . 
ж F 两 组 人 群 中 比例 之 差 的 置信 限 为 


Pi = Р; + z Vpiqi/ Ni + рд›/ №, 
其 中 下 标 1 和 2 分 别 指 青年 人 和 成 年 人 . Р, = 300/600 = 0. 50 和 P, = 100/400= 0.25 分 别 为 青年 人 
和 成 年 人 中 喜爱 此 节目 的 人 数 的 比例 . 
(а) 95% 的 置信 限 为 0.50-0.25+1.96 //0.50 х0. 50/600 + 0.25 х0, 757400-0 25 + 0.06. 因此 我 
们 可 以 有 95% 的 把 握 断 定 真 实 的 比例 之 差 在 0 19 和 0.31 之 间 . 
(b) 99 % 的 置信 限 为 0.50 ~ 0.25 +2.58 vV 0.50 Хх 0. 50/600 + 0.25 х 0. 757400 = 0.25 + 0.08. 因此 我 
们 可 以 有 99% 的 把 握 断 定 真实 的 比例 之 益 在 0 17 和 0.33 Zi. 


某 公司 生产 的 电池 的 平均 电压 为 45 1 伏特 , 标准 差 为 0.04 伏特 .将 四 节 这 样 的 电池 串 
联 起 来 , 求 总 电压 的 (a) 95%, (Ь) 99%, (с) 99.73%, (4) 50% 的 置信 限 . 
Ж EF 如 果 用 Е.Е, Es 和 Е 表示 四 节 电 池 的 电压 , 则 有 


= + нк tup + 


CC 

2 2 2 2 

С = б tot +o 十 с 
E +E, +E, +Е, / E E, Е; Е, 


因为 wp = ue = Мк = нк, = 45.1 H ор = op, TE, TE, 0.04, WA иав 


+E; 
180.4] о. opp p = V4x0.04=0.08. 
1 72 3 74 | 
(а) 95% 的 置信 限 为 180.4+1.96x0.08=180.4+0.16 К. 
(b) 99% УЯ A 180.4+2.58х0.08= 180.4 +0.21 伏特 . 
(с) 99.73% 的 置信 限 为 180.4+3x0.08=180.4+0.24 伏特 . 


(d) 50% 的 置信 限 为 180.4+0.6745x0.08=180.4+0.054 伏特 . 值 0.054 伏特 叫做 可 能 误差 . 
标准 差 的 置信 区 则 


9.17 200 个 灯泡 样品 平均 寿命 的 标准 差 为 100 小 时 . 求 所 有 灯泡 的 标准 差 的 (a) 95%, (b) 
99% 的 置信 限 . 
解 S 总 体 标准 差 o HEARS szo V2N, 其 中 之 对 应 了 置信 水 平 .用 样本 标准 差 估计 о. 
(а) 95% 的 置信 限 是 100 + 1.96 х 100/ V400 = 100+9.8. 因 此 我 们 可 以 有 95% 的 把 握 断 定 总 体 标准 
ŽE 90.2 小 时 和 109.8 小 时 之 间 . 
(b) 99% 的 置信 限 是 100 土 2.58 х 100/ V400 = 100+12.9. 因 此 我 们 可 以 有 99% 的 把 握 断 定 总 体 标 
准 差 在 87.1 小 时 和 112.9 小 时 之 间 . 

9.18 在 习题 9. 17 中 ,为 了 有 99.73% 的 把 握 确 定 总 体 标准 差 与 样本 标准 差 之 差 相对 于 样本 
标准 差 不 超 过 (a) 5%, (b) 10%, 必须 要 抽取 多 大 的 样本 ? 


E F Hostio, 的 99% HERRA s+30//J2N=s+Ł 3s/ V2N, 则 总 体 标 准 差 与 样本 标准 


差 之 差 相 对 于 样本 标准 差 的 百分比 为 
3s/ v2N _ 300 % 
$ v2N 


(а) 如 果 300/ V2N = 5, 则 N=1800. 因 此 样本 容量 应 为 1800 REK. 
(b) 如 果 300/ V2N = 10, W N=450. 因 此 样本 容量 应 为 450 REK. 


9.19 50 地 同 种 型 号 电池 的 电压 均值 为 18.2 伏特 , 标准 差 为 0.5 伏特 . 求 (a) 均值 的 可 能 误 
Z, (b) 50% 的 置信 限 . 


解 EF (a) 


$ 


с 
~= = 0.6745 
VN vN 
、 0.5 , 
= 0.6745 —=— = 0.6745 -之 = 0.048 伏特 
VN -1 v 49 


均值 的 可 能 误差 = 0.674505 = 0.6745 





注意 :如 果 用 s =0.5 代替 о, 可 能 误差 是 0.6745 x (0.5/ V50) =0.048. 所 以 若 N EEK, 两 种 估计 
都 可 用 . 
(b) 50% 的 置信 限 是 18+0.048 伏特 ， 

9.20 一 个 测量 结果 被 记录 为 216. 480 克 , 可 能 误差 为 0.272 15. 这 一 测量 结果 的 95% 的 置 
信 限 是 多 少 ? 
E F 可 能 误差 是 0.272 = 0.674505 8 og = 0. 272/0. 6745. M] 95% 5 X + 1. 960$ = 
216.480 + 1.96 х (0.272/0.6745) = 216.480 + 0.790 ж. 


te RY 1 
无 偏 估计 和 有 效 估计 


9.21 测量 一 组 物体 质量 分 别 为 8.3， 10.6,9.7,8.8,10.2 和 9.4 千克 . 求 (a) 总 体 均 值 的 无 偏 和 有 效 估计 ， 
(b) 总 体 方差 的 无 偏 和 有 效 估计 , (с) 比较 样本 标准 差 和 总 体 标准 差 . 


一 家 公司 生产 的 10 个 电子 管 样品 的 平均 寿命 为 1200 小 时 , 标准 差 为 100 小 时 .估计 这 家 公司 生产 的 


9.22 
所 有 电子 管 寿命 的 (a) ВИН, (b) 标 准 差 . 

9.23 (а) 如 果 有 30, 50 和 100 个 电子 管 样品 ,求解 习题 9.22. 
(b) 对 于 不 同 容 量 的 样本 ,关于 样本 标准 差 和 总 体 标准 差 的 估计 之 间 的 关系 , 你 能 得 到 什么 结论 ? 

均值 的 置信 区 间 

9.24 60 条 缆绳 所 承受 的 最 大 负荷 的 均值 和 标准 差 ( 见 习题 3.59) 分 别 是 11.09 吨 和 0.73 吨 . 求 这 家 公司 生 
产 的 所 有 缆绳 的 最 大 负荷 均值 的 (a) 95% 置信 限 , (b) 99% 置 信 限 . 

9.25 一 家 公司 生产 的 250 个 钾 钉 顶端 直径 的 均值 和 标准 差分 别 为 0.72642 英寸 和 0.00058 英 寸 (见习 题 
3.61) . 求 这 家 公司 生产 的 所 有 锦 钉 顶端 的 平均 直径 的 (a) 99%, (Ь) 98%, (с) 95%, (4) 90% 的 置信 
限 . 

9.26 求 习题 9.25 中 平均 直径 的 (a) 50% 的 置信 限 ，(b) 可 能 的 误差 . 

9.27 ”如 果 电 子 管 寿命 的 标准 差 估 计 为 100 小 时 , 则 要 取 多 大 的 样本 才能 有 (a) 95%, (b) 90%. (с) 99%, (d) 
99.73% 的 把 握 保证 平均 寿命 的 估计 误差 不 超过 20 小 时 ? 

9.28 在 习题 9.27 F, 如 果 平 均 寿命 的 估计 误差 不 超过 10 小 时 , 样本 容量 应 有 多 人 少 ? 

9.29 一 家 公司 有 500 条 电缆 ,从 中 随机 抽取 40 条 检验 , 拉 断 力 的 均值 为 2400 磅 ,标准 差 为 150 磅 . 
(а) З ГЕЈ 460 条 电缆 的 拉 断 力 均值 的 95% 和 99% 的 置信 限 是 多 少 ? 
(b) 我 们 有 多 大 把 握 保 证 剩 下 的 460 条 电缆 的 拉 渐 力 的 均值 在 2400 + 35 磅 之 间 ? 

比例 的 置信 区 间 

9.30 一 个 铅 子 里 装 有 比例 未 知 的 红 球 和 白 球 .从 中 有 放 回 地 抽取 60 个 球 , 其 中 有 70% 是 红 球 .求饶 子 中 红 
球 真 正比 例 的 (a) 95%,(b) 99%, (с) 99.73% 置 信 限 .分 别 用 习题 9.12 中 的 近似 公式 和 更 精确 的 公式 
求 出 结果 ， 

9.31 在 习题 9.30 中 ,应 抽取 多 大 的 样本 才能 有 (a) 95%, (Ь) 99%, (с) 99.73% 的 把 握 保 证 真正 的 比例 和 样 
本 比例 之 差 相 对 于 样本 比例 不 多 于 5%? 

9.32 可 以 相信 ,两 位 侯选人 之 间 将 会 获得 非常 接近 的 选票 , 问 至 少 应 调查 多 少 选民 才能 有 (a) 80%, (b) 
90%, (с) 95%, (4) 99% 的 把 握 确 定 应 支持 哪 一 位 候选 人 ? 

差 与 和 的 置信 区 间 

9.33 A A MIB 两 组 病情 类 似 的 病人 ,分 别 有 50 人 和 100 人 .第 一 组 服用 了 一 种 新 型 的 安眠 药 ， 第 二 组 则 服 
用 普通 的 安眠 药 .A 组 病人 睡眠 时 间 的 平均 值 为 7.82 小 时 ,标准 差 为 0.24 小 时 .B 组 病人 睡眠 时 间 的 
平均 值 为 6.75 小 时 , 标准 差 为 0.30 小 时 . 求 由 这 两 种 药 导 致 的 平均 睡眠 时 间 之 差 的 (a) 95%, (b) 
99% 的 置信 限 . 

9.34 一 台 机 器 生产 的 200 个 螺栓 样品 中 有 15 个 次 品 , 另 一 台 机 器 生产 的 100 个 螺栓 样品 中 有 12 个 次 品 . 
求 这 两 台 机 器 生产 的 产品 中 次 品 比例 之 差 的 (а) 95%, (b) 99%, (с) 99.73% 的 置信 限 . 并 讨论 得 到 
的 结果 . 

9.35 一 家 公司 生产 的 轴承 滚珠 的 平均 重量 为 0.638 ЕЁ, 标准 差 为 0.012 磅 . 求 100 个 轴承 滚珠 重量 的 (a) 
95%, (b) 99% 的 置信 限 . 

标准 差 的 置信 区 间 

9.36 一 家 公司 检验 的 100 条 电缆 的 拉 断 力 的 标准 差 为 180 ЕЁ, 求 这 家 公司 生产 的 所 有 电缆 拉 断 力 的 标准 差 
的 (a) 95%, (Ь) 99% , (с) 99.73% 的 置信 限 . 

9.37 求 习 题 9.36 中 标准 差 的 可 能 误差 . 

9.38 要 抽取 多 大 的 样本 才能 有 (a) 95%, (Ь) 99% ‚(с) 99.73% 的 把 握 保 证 总 体 标准 差 和 样本 标准 差 之 差 


相对 于 样本 标准 差不多 于 2%? 


第 十 章 统计 决策 理论 


统计 决策 


在 实际 问题 中 , 我们 常常 需要 根据 样本 的 信息 对 总 体 情况 作出 决策 .这 些 决策 称 为 统计 决 
策 . 例如, 我们 和 希望 根据 样本 数据 来 判断 一 种 新 药 在 治疗 某 种 疾病 时 是 否 真正 有 效 ,一 种 教学 
方法 是 否 优 于 其 他 的 方法 ,或 是 一 枚 给 定 的 硬币 是 否 负重 . 


统计 假设 
要 作出 某 些 决 策 ,常常 要 对 总 体 先 作 出 菜 些 假定 (或 猜测 ) .这些 假定 可 能 正确 也 可 能 不 正 
确 , 称 为 统计 假设 .它们 一 般 是 关于 总 体 的 概率 分 布 的 某 些 陈述 . 


原 假设 


在 很 多 情况 下 ,我们 给 出 一 个 统计 假设 仅仅 是 为 了 拒绝 它 .例如 ,如 果 我 们 要 判断 给 定 的 
一 榴 硬币 是 否 负 重 , 则 我 们 假设 硬币 是 均匀 的 (好 p=0.5, 其 中 p 是 正面 出 现 的 概率 ). 类 似 
地 ,如果 我 们 要 判断 一 种 方法 是 否 优 王 其 他 的 方法 , 则 我 们 假设 两 种 方法 之 间 没 有 差异 ( 即 观 
察 到 的 差别 仅仅 是 由 同一 总 体 中 抽样 的 波动 性 引起 的 ) .这 样 的 假设 常 称 为 零 假设 或 原 假设 ， 
记 为 Ho. 

备 择 假设 


任何 不 同 于 云 假设 的 假设 都 称 为 备 择 假 设 . 例 如 ,如 果 零 假设 是 p =0.5, 则 备 择 选 择 可 以 
是 p=0.7,p 关 0.5 或 p>0.5. 备 择 假设 记 为 H. 


假设 检验 , 显著 性 检验 或 决策 法 则 


如 来 我 们 假定 某 个 假设 是 正确 的 ,但 又 发 现 观 测 到 的 随机 抽样 的 结果 和 假设 下 预期 的 结 
RA RENAD), 则 我 们 可 以 说 观测 到 的 差别 是 显著 的 , 并 拒绝 该 假设 (至 少 根据 观测 到 的 证 
据 不 能 接受 它 ). 例 如 , 抛 据 一 枚 硬币 20 次 有 16 次 出 现 正面 ,即使 我 们 相信 自己 有 可 能 会 犯 
їн, 我 们 也 会 拒绝 硬币 是 均匀 的 这 一 假设 . 

使 我 们 能 够 判断 观测 到 的 样本 是 否 和 预期 的 结果 有 显著 的 区 别 , 并 帮助 我 们 决定 是 否 接 
受 或 拒绝 假设 的 过 程 叫做 假设 检验 , 显著 性 检验 或 决策 法 则 . 


第 一 类 和 第 二 类 错误 


当 我 们 拒绝 了 一 个 本 应 接受 的 假设 时 ,我 们 就 犯 了 第 一 类 错误 .反之 , 当 我 们 接受 了 一 个 
本 应 拒绝 的 假设 时 , 我 们 就 犯 了 第 二 类 错误 .无论 是 哪 种 情形 , 在 判断 上 我 们 都 犯 了 错误 , 作出 
了 错误 的 决策 . 

为 了 使 决策 法 则 (或 假设 检验 ) 更 好 , 就 必须 要 使 决策 错误 达到 最 小 .这 并 不 是 一 个 简单 的 
问题 , 因为 对 于 任何 给 定 的 样本 容量 ,在 减少 一 种 类 型 错误 的 同时 往往 会 使 另 一 种 类 型 的 错误 
增加 .在 实际 问题 中 , 犯 一 种 类 型 的 错误 可 能 比 犯 另 一 种 类 型 的 错误 更 加 严重 , 这 时 就 要 作出 
一 皮 妥 协 来 限制 更 为 严重 的 那 类 错误 .同时 减少 两 种 类 型 错误 的 惟一 方法 是 增加 样本 容量 , 而 
这 未 必 都 能 做 到 . 


显著 性 水 平 
在 作假 设 检验 时 , 我 们 愿意 犯 第 一 类 错误 的 最 大 概率 称 为 检验 的 显著 性 水 平 .这 个 概率 党 


记 为 a, 通常 都 在 抽样 前 就 指定 好 , 这 样 得 到 的 结果 才 不 会 影响 我 们 的 选择 . 

在 实际 问题 中 , 显著 性 水 平 可 以 有 多 种 选择 ,但 最 为 普通 的 是 0.05 或 0.01. 例 如 ,如果 设 
计 一 个 决策 法 则 选择 的 显著 性 水 平 是 0.05( 或 5%), 那么 在 100 次 中 可 能 有 5 次 机 会 使 我 们 
拒绝 本 该 接受 的 假设 ;也 就 是 说 , 我 们 大 约 有 95% 的 把 握 作 出 正确 的 决策 .此 时 , 我 们 说 拒绝 
假设 的 显著 性 水 平 为 0.05, 即 犯 拒绝 本 应 接受 的 假设 这 类 错误 的 概率 是 0.05. 


关于 正 态 分 布 的 检验 


为 了 说 明 前 面 提 到 的 思想 , 假定 在 一 个 给 定 的 假设 之 下 某 个 统计 量 5 的 抽样 分 布 服从 均 
值 为 js、 标 准 差 为 cs 的 正 态 分 布 . 则 标准 化 变量 (或 z 分 数 )x =(S - ws)/es 的 分 布 是 标准 正 
态 分 布 (均值 为 0, 方 差 为 1). 

如 图 10-1 所 示 , 我 们 能 有 95% 的 把 握 断 定 ; 如果 
假设 是 正确 的 , 则 一 个 实际 的 样本 统计 量 S 的 z 分数 
ТЕ —1.96 和 1.96 之 间 ( 因 为 在 正 态 曲线 下 这 些 值 之 间 ”临界 区 域 | 
的 面积 为 0.9$) .但 是 , 如果 随机 选取 一 个 样本 ,我 们 可 0.025 
能 会 发 现 这 个 统计 量 的 z 分 数 在 ( -1.96,1.96) 之 外 . 
如 果 假 设 是 正确 的 ,我 们 可 以 肯定 这 样 的 事件 发 生 的 
概率 只 有 0.05( 图 中 阴影 部 分 的 总 面积 ). 因此 我 们 可 8 10-1 
以 认为 = 分 数 和 假设 下 的 期 望 值 之 间 有 显著 的 差异 , 从 而 会 拒绝 这 一 假设 . 

明 影 部 分 的 总 面积 0.05 就 是 检验 的 显著 性 水 平 . 它 表示 了 我 们 拒绝 假设 而 犯错 误 的 概率 
( 即 犯 第 一 类 错误 的 概率 ). 所 以 我 们 可 以 说 在 显著 性 水 平 0.05 下 假设 被 拒绝 或 在 水 平 0.05 
下 给 定 的 样本 统计 量 的 z 分数 是 显著 的 . 

在 (-1.96,1.96) 之 外 的 = 分 数 的 集合 构成 了 所 谓 的 假设 的 临界 区 域 , 假设 的 拒绝 区 域 
或 显著 性 区 域 .在 ( -1.96,1.96) 之 内 的 = 分 数 的 集合 称 为 假设 的 接受 区 域 或 非 显著 区 域 

由 上 面 的 陈述 ,我 们 可 以 总 结 出 如 下 的 决策 法 则 (或 假设 检验 或 显著 性 检验 )， 

如 采 统 计量 S 的 z 分 数 在 ( - 1.96,1.96) 之 外 ( 即 z >1.96 或 z< -1.96), 则 以 0.05 的 
显著 性 水 平 拒绝 假设 .否则 接受 假设 (或 如 有 需要 , 不作 任何 决策 ). 

因为 x 分 数 在 假设 检验 中 起 到 了 重要 的 作用 , 故 也 称 之 为 检验 统计 量 . 

要 注意 的 是 也 可 采用 其 他 显著 性 水 平 .例如 ,采用 0.01 的 显著 性 水 平 , 我们 就 要 将 上 面 提 
到 的 1.96 全 部 换 成 2.58( 见 表 10.1). 也 可 利用 表 9.1, 因为 显著 性 水 平和 置信 水 平 之 和 为 
100%. 


双边 检验 和 单 边 检验 


在 前 面 提 到 的 检验 中 , 我 们 关心 的 是 分 布 在 均值 两 侧 ( 即 分 布 的 两 侧 ) 的 统计 量 S 或 相应 
的 z 分 数 的 端 值 .这 样 的 检验 叫做 双边 检验 . | 

但 征 ,我 们 常常 可 能 只 对 均值 一 侧 ( 即 分 布 的 一 侧 ) 的 端 值 感 兴趣 . 例如 我 们 要 检验 一 个 程 
序 优 于 其 他 程序 这 一 假设 (不 同 于 检验 一 个 程序 是 否 区 别 于 其 他 程序 ). 这 样 的 检验 叫做 单 边 
检验 .此 时 ,临界 区 域 位 于 分 布 的 一 侧 , 它 所 对 应 的 面积 等 于 显著 性 水 平 . 

表 10.1 给 出 了 在 不 同 的 显著 性 水 平 下 , > 在 单 边 检 验 和 双边 检验 中 的 临界 值 , 很 具有 参 
考 价值 .对 应 于 其 他 显著 性 水 平 的 z 的 临界 值 可 由 正 态 曲线 面积 表 ( 附 录 1 ) 求 得 
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表 10.1 


特殊 检验 


在 大 样本 情形 ,许多 统计 量 的 抽样 分 布 都 是 正 态 分 布 (或 至 少 接 近 于 正 态 ), 相应 的 z 分 
效 就 可 应 用 于 前 面 提 到 的 检验 .下 面 列 出 的 特殊 检验 仅 是 实际 中 常用 的 几 个 检验 , 它们 所 用 的 
ФИНАЛА Н ж 8.1. 对 无 限 总 体 或 从 有 限 总 体 中 有 放 回 抽样 ,这 些 方法 都 适用 .对 从 有 限 总 
体 中 无 放 回 抽样 ,结论 必须 作 些 修正 . 
1. 均值 :此 时 S=XX 为 样本 均值 ;ys= ру = u 为 总 体 均 值 ;cs =оу=ово/ VN, 其 中 o 是 总 
体 标准 差 , N 是 样本 容量 . 则 z 分 数 为 
X-u 
ol ум 
如 有 必要 , 可 用 样本 标准 差 或 估计. | 
2. 比例 :此 时 S= 己 为 一 个 样本 中 ?成 功 "的 比例 ;ps= wp= р, EP р 是 总 体 中 成 功 的 比 
例 ;cs= сь = / po/N ,其 中 q = 二 1~p, NN 是 样本 容量 .xz 分 数 为 
P-p 
Vpg/N 
ШЖ P=X/N, 其 中 X 是 样本 中 成 功 的 次 数 , x 分 数 变 为 
_ X- № 
之 一 /Npa 
BI х= p= Np,ox=o= YNpq 且 S= 义 .对 于 其 他 统计 量 的 结果 可 类 似 地 得 到 


OC 曲线 ,检验 的 功效 


我 们 已 经 看 到 如 何 选 择 合适 的 显著 性 水 平 以 限制 第 一 类 错误 .而 完全 避免 冒险 犯 第 二 类 
错误 的 惟一 方法 是 不 接受 任何 假设 .但 是 在 许多 情况 下 , 这 都 是 不 可 能 的 . 此 时 , 常常 要 用 到 
OC 曲线 (Operating-Characteristic Curve), 这 种 曲线 表明 了 在 各 种 假设 下 犯 第 二 类 错误 的 概 
率 ,为 如 何在 一 个 给 定 的 检验 中 减少 第 二 类 错误 提供 了 指示 ;也 就 是 说 ， 这 种 曲线 表示 了 防止 
我 们 作出 错误 决策 的 检验 功效 .这 在 设计 时 是 非常 有 用 的 ， 因为 它 常 常 能 为 我 们 指明 所 需 的 样 
本 的 容量 . 
控制 图 

在 实际 问题 中 ,很 重要 的 一 件 事 是 了 解 一 个 过 程 何 时 有 了 改变 ， 从 而 需要 采取 一 些 弥 补 的 
措施 . 比如 在 质量 控制 中 就 会 遇 到 这 种 问题 . 质量 控制 管理 者 常常 要 判定 观测 到 的 质量 变化 是 
偶尔 的 波动 还 是 由 生产 过 程 中 的 一 些 真 正 变 化 引起 的 ， 如 机 需 零 件 的 损坏 , 员工 的 过 失 等 . 控 
制图 为 解决 这 类 问题 提供 了 一 个 简单 有 用 的 方法 . 


有 关 样 本 差 的 检验 
38185 # 


z 一 


有 两 个 均值 分 别 为 p 和 pa, 标准 差分 别 为 cr 和 o 的 总 体 ， 分 别 从 中 抽取 一 个 样本 容量 
为 Ni 和 NCN, № 均 较 大 ) 的 样本 , 样本 均值 为 这 ЖП Х.. 考察 原 假设 :两 个 总 体 均值 之 间 
ARACI и = jy,). 也 就 是 说 样本 是 从 两 个 均值 相同 的 总 体 中 抽取 的 

将 u= jy 代入 第 八 章 的 (5) 式 ， 可 得 均值 之 差 的 抽样 分 布 近似 于 正 态 分 布 , 它 的 均值 和 


方差 为 
2 2 
_—о_ _ _ _ рд}, 0) 
HX -X, 0 IX-X, { М, + N, (1) 


如 有 需要 ， 可 用 样本 标准 差 51 和 s2( 或 $1 和 Sa Mtt Oi 和 бә. 
应 用 标准 化 变量 


„_ XX- 0 X-X, 9) 
054 IX-X, 
我 们 可 在 一 个 适宜 的 显著 性 水 平 下 对 原 假 设 与 备 择 假设 (或 观测 到 的 差异 的 显著 性 ) 作 出 检 


比例 之 差 


有 两 个 总 体 的 比例 分 别 为 pi 和 p;, 分 别 从 中 抽取 一 个 样本 容量 为 Ni 和 NNi, № 均 
较 大 ) 的 样本 ,样本 比例 分 别 为 Pi 和 P: .考察 原 假设 :两 个 总 体 参 数 之 间 没 有 差异 ( 即 р, = 
p2), 即 样本 是 从 相同 的 总 体 中 抽取 的 . 

将 p= p= p 代入 第 八 章 (6) 式 , 可 得 比例 之 差 的 抽样 分 布 近似 于 正 态 分 布 , 它 的 均值 和 
方 老 分 别 为 


1 1 
Hp -P, = 0 Ор -р, 一 pal М, + М) (3) 
N P, + N-P 、 
ap p= Тас 人 2 是 总 体 比例 的 一 个 估计 ,9 = 1- у, 

Nit №, 
应 用 标准 化 变量 

z = -P20 Р-Р, (4) 

Fp -P, бр -P 


我 们 可 在 一 个 适宜 的 显著 性 水 平 下 检验 原 假设 . 
有 关 其 他 统计 量 的 检验 也 可 类 似 地 设计 . 


关于 二 项 分 布 的 检验 
关于 二 项 分 布 (以 及 其 他 分 布 ) 的 检验 ,可 通过 用 与 正 态 分 布 的 检验 相 类 似 的 方法 而 得 , 最 
基本 的 原理 在 本 质 上 都 是 相同 的 .见习 题 10.23 至 10.28. 
习题 及 解答 
用 正 态 分 布 检验 均值 和 比例 


10.1 抛掷 一 枚 均匀 硬币 100 次 , 求 有 40 次 到 60 次 出 现 正面 的 概率 . 
解 ”& 由 二 项 分 布 ,要 求 的 概率 是 


100 1 40 60 100 41 59 100 
ЕЯ (4) TONIES (4) + | (а |* 
因为 Np=100x 方 和 Ng = 100x 方 都 比 5 大 ,因此 可 用 二 项 分 布 的 正 态 过 近来 求 这 个 和 . ШШ 
硬币 100 次 ,正面 出 现 次 数 的 均值 和 标准 差 为 


n= № = 100х-у = 50 s= У = 100х 5х 2 = 5 


从 连续 的 角度 来 考虑 , 40 到 60 次 出 现 正面 相当 于 39.5 到 60.5 次 出 现 正 面 . 则 有 


39.5 的 标准 值 = 32.3 50L a 10 








60.5 的 标准 值 = 20:5 205 10 


要 求 的 概率 = ( 正 态 曲 线 下 zx = -2.10 和 > = 2.10 之 间 的 面积 ) 
=2x(tz=0 和 >z=2.10 之 间 的 面积 ) = 2 x 0.4821 = 0.9642 
10.2 为 了 检验 一 枚 硬币 是 均匀 的 , 采用 如 下 的 决策 法 则 ; 
如 采 抛 掷 硬币 100 次 有 40 到 60 次 出 现 正 面 , 则 接受 假设 .否则 拒绝 假设 
(а) 求 拒 绝 了 正确 假设 的 概率 . 


10.3 


(b) 作 图 表示 决策 法 则 和 (a) 中 的 结果 . 

(с) 如 果 抛 掷 便 币 100 次 有 53 次 出 现 正面 ,你 能 得 到 什么 结论 ?” “Ж 60 次 出 现 正 面 ， 

又 能 得 到 什么 结论 ? 

(а) 你 在 (c) 中 得 到 的 结论 是 否 有 可 能 出 错 ? 并 解释 原因 

ЯЕ F (а) 由 习题 10.1, 如果 硬币 是 均匀 的 , 则 出 现 正面 的 次 数 不 在 40 到 60 之 间 的 概率 为 1- 

0.9642=0.0358. 则 拒绝 了 正确 假设 的 概率 是 0.0358， 

(b) 图 10-2 表 示 的 是 决策 法 则 ,给 出 了 抛掷 均匀 硬币 100 次 正面 出 现 次 数 的 概率 分 布 . 若 由 包含 100 

次 抛掷 的 样本 得 到 的 « 分 数 在 -2.10 和 2.10 之 间 , 我 们 就 接受 假设 ;和 否则 就 拒绝 假设 ,断定 硬币 是 

不 均匀 的 . l 

拒绝 了 本 应 接受 的 假设 犯 了 第 一 类 错误 .由 (a), 犯 这 

一 错误 的 概率 等 于 0.0358, 即 为 图 中 阴影 部 分 所 示 . 

如 果 由 包含 100 次 抛掷 的 样本 得 到 的 z 分 数 (或 z 统 

计量 ) 在 阴影 区 域内 ,我 们 可 以 认为 « 分 数 与 在 假定 

假设 是 正确 的 条 件 下 得 到 的 结果 有 显著 的 不 同 .为 此 ， 

阴影 部 分 的 总 面积 ( 即 第 一 类 错误 的 概率 ) 称 为 决策 法 

则 的 显著 性 水 平 ,在 本 题 中 显著 性 水 平等 于 0.0358. 
图 10-2 因此 ,我 们 可 以 说 在 0.0358( 或 3.58% ) 的 显著 性 水 平 

下 拒绝 了 假设 . 

(с) 根据 决策 法 则 , 在 两 种 情形 下 我 们 都 不 得 不 接受 硬币 是 均匀 的 这 一 假设 .有 人 会 争辩 说 只 要 再 多 

一 次 出 现 正 面 ,我 们 就 要 拒绝 假设 .而 这 是 我 们 在 制定 决策 法 则 划 定 界限 时 必须 要 面临 的 问题 

(d) 有 可 能 .我 们 可 能 会 接受 了 本 应 拒绝 的 假设 .如 在 本 题 中 ,正面 出 现 的 概率 也 许 是 0.7 而 不 是 0.5. 

接受 了 本 应 拒绝 的 假设 犯 了 第 二 类 错误 (更 详细 的 讨论 见习 题 10.10 至 10.12). 

抛 毛 一 枚 硬币 64 次 ,在 (a) 0.05, (b) 0.01 的 显著 性 水 平 下 ,制定 -一 个 决策 法 则 检验 硬 

币 的 均匀 性 . 

E S (a) 解法 一 如 果 显 著 往 水 平 是 0.05, 则 由 对 称 性 , 图 10-3 中 每 一 边 的 面积 都 是 0.025 因 

此 ,0 和 z, 之 间 的 面积 为 0.5000 ~ 0.0250 = 0.4750, 2, =1.96. 也 可 从 表 10.1 中 得 到 临界 值 -1.96 

和 1.96. 所 以 一 个 可 能 的 决策 法 则 是 ， 

ШЖ = 在 -1.96 和 1.96 之 间 , 则 接受 硬币 是 均匀 的 这 一 假设 .否则 就 拒绝 假设 

为 了 用 64 次 抛 撕 中 正面 出 现 的 次 数 表达 决策 法 则 ， 注意 到 如 果 假 设 是 正确 的 ,正面 出 现 次 数 的 
分 布 的 均值 和 标准 差 为 

н = Np=64x0.5=32 s= / Мру = /64х0.5х0.5 ~ 4 
Щт®=(Х-н)/о=(Х- 32)/4.Ж z=1.96, R(X —32)/4= 1.96, X = 39.84; z= —1.96, Ш(Х- 
32)/4 = -1.96,X=24.16. 因 此 决策 法 则 变 为 ， 

如 果 正 面 出 现 的 次 数 在 24.16 和 39.84( 即 25 和 39) 之 间 ， 则 接受 硬币 是 均匀 的 这 一 假设 .否则 
解法 二 正面 出 现 的 次 数 以 0.95 的 概率 在 y 1.960 和 w+1.96c( 即 Np -1.96 / Npg 和 Np+ 
1.96V Мр 2 #]), ЯЛЕ 32 -1.96х4= 24.16 #132+1.96х4- 39.84 2 [8]. 由 此 即 可 得 上 述 的 决策 
法 则 . 


接受 区 域 





z =—2.10 z =2.10 
(出 现 正 面 39, 5 次 ) 出现 正面 60. 5 次 ) 


解法 三 ~1.96< z<1.96 RHH F -1.96< (X - 32) 
<1.96, MÍ - 1.96 x 4< X – 32<1.96 x4, 也 就 是 32-1.96 
X 4< Х<32+1.96х 4(8] 24.16< X<39.84), 这 就 得 到 了 
上 述 的 决策 法 则 . 

(b) 如 采 显 著 性 水 平 是 0.01, 图 10-3 中 每 一 边 的 阴影 部 分 
面积 就 是 0.005. 则 0 和 z, 之 间 的 面积 是 0.5000 — 0.0050 = 
0.4950, z1=2.58( 更 精确 为 2.575), 这 也 可 从 表 10.1 中 找 图 10-3 

到 . 同 (a) 中 解法 二 的 步骤 ,正面 出 现 的 次 数 以 0.99 的 概率 

ТЕ u -2.580 和 w+2.$8c, 或 32-2.58x4=21.68 和 和 32+2.58х4=42.32 2 Ùl. БЇК НЕ УЕ ШЇ ЛЕ 





10.4 


10.5 


10.6 


为 : 

如 果 正 面 出 现 的 次 数 在 22 和 42 227 [8], 则 接受 硬币 是 均匀 的 这 一 假设 .否则 就 拒绝 假设 . 
在 习题 10.3 F, 如 何 制定 一 个 决策 法 则 以 避免 犯 第 二 类 错误 ? 
М тв 接受 了 本 应 拒绝 的 假设 就 犯 了 第 二 类 错误 .我 们 可 以 这 样 避 免 犯 此 类 错误 ;以 不 拒绝 假设 
代替 接受 假设 .这 就 意味 着 在 这 种 情形 下 我 们 并 没有 给 出 任何 决策 .例如 ,我 们 可 将 习题 10.3(b) 中 
的 决策 法 则 改 为 : 

如 果 正 面 出 现 的 次 数 在 22 和 42 之 间 , 则 不 拒绝 硬币 是 均匀 的 这 一 假设 .否则 就 拒绝 假设 . 
但 是 在 很 多 实际 问题 中 , 决定 接受 或 拒绝 假设 非常 重要 .这 种 情形 下 的 详细 讨论 要 考虑 到 第 二 类 错误 
(见习 题 10.10 至 10.12). 
在 一 个 关于 超 感 觉 (ESP) 力 的 试验 中 , 一 间 房 间 里 的 一 个 人 从 洗 好 的 50 张 卡片 中 随机 
抽取 一 张 ,而 在 另 一 交房 间 里 的 人 (主体 ) 要 说 出 卡片 的 颜色 ( 红 或 蓝 ) .接受 试验 的 主体 
并 不 知道 有 多少 张 红 色 和 蓝 色 的 卡片 . 如果 主体 能 准确 地 说 出 32 张 卡片 的 颜色 , ТЕ (а) 
0.05, (b) 0.01 的 水 平 下 判定 结果 是 否 是 显著 的 . 
解 KF ШЖ p 表示 主体 能 准确 地 说 出 卡片 颜色 的 概率 , 则 我 们 不 得 不 在 下 面 的 两 个 假设 中 作出 
选择 : 

Не:р = 0.5, 主体 只 是 单 任 猜测 ( 即 结果 只 是 出 于 偶然 ). 

Н\:р>0.5, 主体 有 EP H. 
因为 我 们 并 不 关心 得 低 分 的 主体 ,而 只 是 关心 那些 得 高 分 的 主体 , 所 以 选择 用 单 边 检 验 . 假定 Ho 是 
正确 的 , 则 能 被 准确 地 说 出 颜色 的 卡片 张 数 的 均值 和 标准 差 为 

u= № = 50 х 0.5 = 25 o= VNpg = /50х0.5х0.5 = /12.5 -= 3.54 

(а) 对 于 显著 性 水 平 为 0.05 的 单 边 检 验 ,我 们 必须 如 图 10 
-4 选择 z| 值 ,这 样 阴影 部 分 表示 的 高 分 临界 区 域 的 面积 为 
0.05. 则 0 和 zi 之 间 的 面积 是 0.4500, z=1.645, 这 也 可 从 
Ж 10.1 中 找到 .所 以 ,我 们 的 决策 法 则 (或 显著 性 检验 ) 为 ， 

如 果 观 测 的 z 分 数 大 于 1.645, 则 结果 在 0.05 的 水 平 下 
是 显著 的 ,主体 有 ESP 力 .如 果 > 分 数 小 于 1.645, 则 结果 只 
是 出 于 偶然 ( 即 在 0.05 的 水 平 下 不 显著 ). 图 10-4 
因为 32 的 标准 值 是 (32 - 25)/3.54=1.98, 大 于 1.645, 我 们 
可 以 断定 在 0.05 的 水 平 下 , 主体 有 ESP Л. 

注意 ,实际 上 , 我 们 应 该 作 一 个 关于 连续 的 修正 .而 从 连续 的 角度 来 考虑 , 32 在 31.5 和 32.5 之 
间 .31.5 的 标准 值 是 (31.5 一 25)/3.54=1.84, 所 以 可 得 到 相同 的 结论 . 
(b) 如 果 显 著 性 水 平 是 0.01,0 和 =, 之 间 的 面积 是 0.4900, z; = 2.33. 由 于 32( 或 31.5) 的 标准 值 是 
1.98( 或 1.84), 小 于 2.33, 我 们 可 以 断定 结果 在 0.01 的 水 平 下 不 显著 

有 些 统计 学 家 这 样 采用 术语 表达 ;如 果 结 果 在 0.01 的 水 平 下 显著 , 则 称 为 高 度 显著 . 如 果 在 0.05 
的 水 平 下 显著 ,但 在 0.01 的 水 平 下 不 显著 则 称 为 可 能 显著 .如 果 在 大 于 0.05 的 水 平 下 显著 , 则 称 为 
个 显著 .根据 这 些 术语 , 我 们 可 以 断定 上 述 的 试验 结果 可 能 显著 , 所 以 还 需要 就 此 再 做 一 些 深 入 的 研 
R. 

因为 在 作 决 策 时 , 显著 性 水 平 相当 于 一 个 向 导 , 所 以 有 些 统计 学 家 就 引用 了 所 谓 的 真实 概率 . 例 
如 在 本 题 中 , Р( 2221.84) =0.0322, 统计 学 家 会 说 :根据 这 个 试验 , 100 次 中 大 约会 有 3 次 机 会 错误 判 
定 某 个 人 有 ESP 力 .被 引用 的 概率 (本 题 中 是 0.0322) 称 为 检验 的 pE. 
某 成 药 制造 商 声明 他 有 90% 的 把 握 保 证 他 的 药 能 有 效 缓解 过 敏 达 8 小 时 .从 患 有 过 敏 
钙 的 人 中 随机 抽取 200 人 ,服药 后 有 160 人 的 症状 得 到 了 缓解 .判定 此 制造 商 的 吉明 是 
否 真 实 ， 
# з; Hp 表示 服药 后 过 敏 症 得 到 缓解 的 概率 , 则 我 们 必须 在 下 面 的 两 个 假设 中 作出 选择 . 

Ho:p=0.9, 声 明 是 真实 的 ， 

Н\:р<0.9, 声明 是 不 真实 的 . 
因为 我 们 只 关心 得 到 缓解 的 比例 是 否 太 低 ， 所 以 可 选择 单 边 检验 .如 果 显 著 性 水 平 是 0.01( 即 如 果 图 





10.7 


10-5 中 阴影 部 分 的 面积 是 0.01), 则 可 同 习题 10.5(b) 一 
样 利 用 曲线 的 对 称 性 或 查 表 10.1 得 z= -2.33. 因 此 我 
们 的 决策 法 则 为 : 

ШЖ z 小 于 -2.33, 则 声明 是 不 真实 的 (此 时 我 们 拒 
绝 假 设 Но). 否则 声明 是 真实 的 ,观测 到 的 结果 只 是 出 于 
偶然 (此 时 我 们 接受 假设 Ho). 

图 10-5 ж Ho 是 真 的 , 则 y= №р = 200 х 0.9 = 180 Н о = 
V Npg = / 200 х 0.9х0.1= 4.24. kk 160 的 标准 值 是 

(160 ~ 180)/4.24= -4.72, 于 -2.33. 所 以 ,根据 我 们 的 决策 法 则 可 断定 声明 是 不 真实 的 且 试 验 结果 
高度 显著 的 (见习 题 10.5 的 结尾 ). 
我 们 规定 一 个 假设 检验 的 p- 值 是 拒绝 零 假设 的 最 小 显著 性 水 平 . 本题 说 明了 计算 检验 
统计 量 р 值 的 方法 .用 习题 9.6 中 的 数据 检验 零 假设 :所 有 树木 的 平均 高 度 等 于 5 Ж 
矿 . 备 择 假设 :平均 高 度 小 于 $ 英尺 . 找 出 这 个 检验 的 p- 值 . 
解 ES 计算 出 的 z 值 是 z=(59.22- 60)/1.01= -0.77. 拒 绝 零 假设 的 最 小 显著 性 水 平 就 是 p 
值 ,为 P(z< -0.77) = 0.5 – 0.2794 = 0.2206. 如果 р 小 于 预先 给 定 的 显著 性 水 平 , 就 要 拒绝 零 假 
没 . 在 本 题 中 ,如 果 显 著 性 水 平 给 定 为 0.05, 零 假设 就 不 会 被 拒绝 . Minitab 的 结果 如 下 所 示 , 其 中 子 
命令 Altrernative -1 表示 细 昆 检验 . 
MTB> ZTest mean= 60 sd = 10.111 data in cl; 
SUBC > Alternative —1. 
Z-Test 
Test of mu = 60. 00 vs mu< 60.00 





The assumed sgma = 10.1 

Variable N Mean StDev SE Mean Z P 

height 100 59.22 10.11 1.01 -0.77 0.22 

从 收听 收音 机 的 人 群 中 随机 抽取 33 个 人 , 记录 下 他 们 每 周 收听 的 时 间 , 以 小 时 为 单位 

的 数据 如 下 ， 
98748 6 8 8 7 10 8 10 6 7 7 8 9 
658568785 58 7 6 6 4 5 

ТЕ а =0.05 的 显著 性 水 平 下 ， 以 下 列 三 种 方式 检验 j=5 的 零 假设 对 4 关 5 的 备 择 假 

设 ， 

(а) 计算 检验 统计 量 的 值 ,并 和 a =0.05 的 临界 值 相 比 较 . 

(b) 计算 对 应 于 已 求 出 的 检验 统计 其 的 p 值 ,并 将 р 值 和 a=0.05 相 比 较 . 

(с) Жи 1-a=0.95 的 置信 区 间 , 并 判断 5 是 否 落 在 此 区 间 内 

解 ФЕ 在 下 面 的 Minitab 的 输出 结果 中 , 先 给 出 了 标准 差 ， 然后 又 分 别 给 出 了 Ztest 和 Zinterval 的 

结果 . 

MTB > standard deviation cl 

Standard deviation of hours = 1.6005 

MTB >ZTest 5.0 1.6005’ hours’ ; 

SUBC > Alternative 0. 

Z-Test 

Test of mu = 5.000vs mu not = 5.000 

Fhe assumed sigma =1.60 

Variable N Mean StDev SE Mean z p 

hours 33 6.897 1.600 0.279 6.81 0.0000 

MTB > Zinterval 95.0 1.6005'hours’. 

апае N Mean StDev SE Mean 95.0%CI 

hours 33 6.897 1.600 0.279 (6.351,7.443) 





(а) 计算 得 检验 统计 量 的 值 为 = HS = 6.81, 临 界 值 为 1.96, 因 此 要 拒绝 零 假设 .注意 , 计算 
出 的 值 在 Minitab 的 结果 中 己 有 显示 . 
(b) 由 Minitab 的 结果 户 值 为 0.0000, 因 为 户 值 Ca=0.05, 所 以 要 拒绝 地 假设 . 
(с) 因为 零 假 设 指定 的 5 并 没 包 含 在 p 的 95% 的 贰 信 区 间 内 ,所 以 要 拒绝 矢 假 设 . 
这 三 种 程序 在 检验 零 假 设 对 双边 的 备 择 假 设 时 是 等 价 的 . 
10.9 某 工 厂 生 产 的 电缆 的 平均 拉 渐 力 为 1800 磅 ,标准 差 为 100 磅 .据说 进行 了 技术 革新 后 ， 
电缆 的 拉 断 力 可 以 得 到 提高 .为 了 检验 这 一 说 法 , 随机 抽取 50 条 电缆 发 现 它们 的 平均 
拉 断 力 是 1850 磅 .我 们 能 否 在 0.01 的 显著 性 水 平 下 支持 这 一 说 法 ? 
# F 我 们 必须 在 下 面 两 个 假设 中 作出 选择 : 
Ho: н = 1800 磅 , 拉 断 力 并 没有 真正 改变 . 
Н\: м >1800 磅 , 拉 断 力 确 有 改变 . 
这 里 要 用 单 边 检验 , 与 此 相关 的 图 和 习题 10.5(a) 中 的 图 10 -4 一 样 .在 0.01 的 显著 性 水 平 下 ， 
决策 法 则 如 下 : 
如 果 观 测 到 的 = 分 数 大 于 2.33, 则 结果 在 0.01 的 水 平 下 是 显著 的 ,要 拒绝 Н. 否则 就 接受 Ho 
(或 不 作出 决策 ). 
假定 Ho 是 正确 的 ,我 们 有 
_ Хи _ 1850-1800 _, << 
o/ VN 100/ V50 
它 大 于 2.33. 因 此 ,我 们 可 以 断定 结果 是 高 度 显著 的 且 要 支持 这 一 说 法 . 


OC 曲线 


z 


10.10 参见 习题 10.2, 当 正 面 出 现 的 真实 概率 p =0.7 时 , 接受 硬币 是 均匀 的 概率 是 多 少 ? 
EO S 当 抛掷 硬币 100 次 有 39.5 到 60.5 次 出 现 正 面 时, 接受 硬币 是 均匀 ( 即 p=0.5) 的 假设 . 


图 10- 6 中 左边 的 正 态 曲线 下 方 阴影 部 分 面积 а 表示 了 拒绝 本 应 接受 的 假设 Ho 的 概率 ( 即 犯 第 一 
类 错误 的 概率 ). 如 习题 10.2(a) 中 所 求 ,这 一 面积 a 表示 的 是 检验 的 显著 性 水 平 ,等 于 0.0358. 


р=0.5 р =07 





如 果 正 面 出 现 的 概率 是 p 0.7, ЯВ 100 次 中 正面 出 现 次 数 的 分 布 由 图 10-6 中 右边 的 正 态 曲 
线 所 表示 . 可 以 清楚 地 看 到 当 户 =0.7 时 接受 Ho 的 概率 ( 即 犯 第 二 类 错误 的 概率 ) 等 于 图 中 画 斜 线 
部 分 的 面积 8. 为 了 计算 这 个 面积 ,我 们 求 得 在 = 0.7 的 假设 下 分 布 的 均值 和 标准 差 为 
и = Np =100x0.7=70 o= VNpg = /100х0.7х0.3 = 4.58 


60.5 的 标准 值 = 5°. 3—70 =— 2.07 39.5 的 标准 值 = 250 = – 6.66 





则 
8 = ( 正 态 曲线 下 z = - 6.66 和 > =- 2.07 之 间 的 面积 ) = 0.0192 
因此 根据 给 定 的 决策 法 则 , 当 p=0.7 时 接受 硬币 是 均匀 的 机 会 很 小 . 
注意 , 在 本 题 中 ,已 知 决策 法 则 , 再 计算 a 和 8B. 事 实 上 ,还 可 能 是 下 面 两 种 情况 ， 
(1) 由 a( 如 0.05 或 0.01) 得 到 决策 法 则 , 从 而 再 计算 8. 
(2) 由 a ЖП 8 得 到 决策 法 则 . 


10.11 当 (a) p=0.6,(b) p=0.8,(c)p=0.9,(d) p=0.4 时 求解 习题 10.10. 


10.12 


解 F (al) 若 =0.6, 正 面 出 现 次 数 的 分 布 的 均值 和 标准 差 为 
и = № = 100x0.6=60 s= / Мру = J100x0.6x0.4 = 4.90 








_ _60.5-60 _ 
60.5 的 标准 值 = чой = 0-102 

_39.5-60 __ 
39.5 的 标准 值 = 490 77418 


则 

В = ( 正 态 曲线 下 = =- 4.18 和 > = 0.102 之 间 的 面积 ) = 0.5406 
因此 根据 给 定 的 决策 法 则 , 当 p=0.6 时 接受 硬币 是 均匀 的 机 会 很 大 . 
(b) Æ p=0.8, W 

и = Np =100x0.8 = 80 s= VNpg = /100х0.8х0 2 = 4 


60.5 的 标准 值 = бэ 80 _ 4.88 








39.5 的 标准 值 = 


32.5- 80 удро 


则 
В = ( 正 态 曲线 下 = = - 10.12 和 z =- 4.88 之 间 的 面积 ) 近似 为 0.0000 
(с) 和 (b) 相 比较 或 通过 计算 知 :如 户 =0.9, 则 在 实际 问题 中 近似 有 8= 0. 
(d) 由 对 称 性 , p =0.4 和 p=0.6 得 到 的 8 值 相同 ( 即 B=0.5040). 
作 表 示 习 题 10.10 和 10.11 中 结果 的 (a)8 对 >, (Ь)1 -E XÍ p 图 ,并 作出 说 明 . 


Й F 表 10.2 给 出 了 习题 10.10 和 10.11 中 得 到 的 对 应 于 p 值 的 8 值 .注意 , 8 表示 的 是 当真 


正 的 р 不 等 于 0.5 但 接受 了 p=0.5 的 概率 ; 若 真 正 的 户 等 于 0.5, 则 8 表示 的 是 接受 本 应 接受 的 p 
=0.5 的 概率 .这 一 概率 是 1- 0.0358=0.9642, 也 已 列 在 了 表 10.2 +. 


Ж 10.2 


0.0000 0.0000 0.0192 0.5040 0.9642 0.5040 0.0192 0.0000 


(a) 8 对 p 的 关系 如 图 10-7(a) 所 示 ， 这 种 图 形 叫做 决策 法 则 (或 假设 检验 ) 的 OC 曲线 .曲线 上 的 最 高 
扩 和 直线 8=1 的 距离 等 于 a= 0.0358, 即 检验 的 显著 性 水 平 . 
一 般 说 来 ,OC 曲线 的 峰 越 尖 ， 决策 法 则 在 拒绝 不 成 立 的 假设 时 效果 越 好 . 









В 1-8 
| о =0.0358 
+ 
р L а =0.0358 
0.2 0.4 0.6 0.8 1.0 





图 10-7 


10.13 


10.14 


(b) 1-8 X$ p 的 关系 如 图 10-7(b) 所 示 , 这 种 图 形 叫 做 决策 法 则 的 功效 曲线 , 只 要 将 OC 曲线 倒置 
即 得 ,因此 两 种 曲线 实际 上 是 等 价 的 . 

因为 1-8 表 示 的 是 拒绝 本 应 拒绝 的 (或 不 成 立 的 或 错误 的 ) 假 设 (拒绝 这 种 假设 是 应 该 的 , E 
确 的 ) 的 检验 功效 ,所 以 常 称 为 功效 函数 . 8 也 称 为 检验 的 运算 特性 函数 . 
某 工厂 生产 的 绳子 的 平均 拉 断 力 是 300 磅 ,标准 差 是 24 磅 . 现 改 进 生 产 方 法 , 绳子 的 
拉 渐 力 将 会 得 到 提高 . 
(а) 检验 64 条 绳子 , 在 0.01 的 显著 性 水 平 下 设计 一 个 决策 法 则 以 废除 旧 的 生产 方 
法 . 
(b) 在 (a) 中 得 到 的 决策 法 则 下 , 当 新 的 生产 方法 使 得 绳子 的 平均 拉 断 力 提高 到 310 
磅 时 , 检验 结果 却 接受 旧 的 方法 的 概率 是 多 少 ? 假定 标准 差 还 是 24 磅 . 
E E (а) 若 j 表示 平均 拉 断 力 , 我们 就 要 在 下 面 的 两 个 假设 中 作出 选择 : 

Ho: u = 300 磅 ,新 的 方法 得 的 一 样 . 

H: u >300 磅 ,新 的 方法 比 旧 的 好 . 
对 于 显著 性 水 平 为 0.01 的 单 边 检验 ,我们 有 如 下 的 决策 法 则 (参考 图 10-8(a)); 

如 果 样 本 平均 拉 断 力 的 > 分 数 大 于 2.33 就 拒绝 Ho. 否则 就 接受 Ho. 
因为 


>< | 


„X-u _ Х-300 
o/ VN 24/ /64 





zoi Ха 
Ф 
300 Ж 300 307 310 
(а) (b) 
图 10-8 


则 有 X=300+3z. 4 z >2.33, 1 X >300+3Xx2.33=307.0 磅 .因此 ,上 面 的 决策 法 则 变 为 ; 

ШЖ 64 条 绳子 的 平均 拉 断 力 超过 307.0 磅 就 拒绝 Н. 否则 就 接受 H 
(b) 考虑 假设 Ho: и = 300 磅 和 Н,: w=310 磅 .图 10-8(b) 中 的 左右 两 条 正 态 曲线 分 别 表示 这 两 个 
假设 下 的 平均 拉 断 力 的 分 布 .图 10-8(b) 中 的 面积 8 表示 的 是 当 新 的 平均 拉 靳 力 提 高 到 310 磅 时 ， 
检验 结果 却 接受 旧 方 法 的 概率 .为 求 得 B. 注意 到 307.0 磅 的 标准 值 是 (307.0 - 310)/3 = -1.00, 因 
此 

В = (右边 正 态 曲线 下 z = - 1.00 左 方 的 面积 ) = 0.1587 

这 就 是 当 及 ;y= 310 磅 成 立时 却 接受 Ho: u= 300 磅 的 概率 ( 即 犯 第 二 类 错误 的 概率 ). 
假定 拉 断 力 的 标准 差 仍 是 24 磅 , 作 习 题 10.13 中 的 (a) OC 曲线 ;(b) 功效 曲线 . 


解 ES 同 习题 10.13(b), 当 新 的 方法 使 得 平均 拉 断 力 и 等 于 305 磅 ,315 磅 时 ,我 们 可 求 出 相应 


的 ‚лепес, 磅 , 则 307.0 磅 的 标准 值 是 (307.0 - 305)/3 = 0.67, 因此 
=【〈 右 边 正 态 曲线 下 z = 0.67 左 方 的 面积 ) = 0.7486 


ARTAR 10.3. 











0.7486 0.1587 


(а) OC 曲线 如 图 10.9(a) 所 示 . 由 此 曲线 可 见 ， 当 新 的 平均 拉 断 力 小 于 300 磅 时 保持 旧 的 生产 方法 









0.0038 0.0000 
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的 概率 实际 上 是 1( 在 新 的 平均 值 为 300 磅 时 是 1 减 去 显著 性 水 平 0.01). 然 后 曲线 就 快速 下 降 到 
零 ,这 表示 当 平 均 拉 断 力 大 于 315 磅 时 , 实际 上 没有 任何 可 能 保持 旧 的 方法 . 

(b) 功效 曲线 如 图 10-9(b) 所 示 . 对 于 功效 曲线 的 解释 和 ОС 曲线 一 样 .事实 上 , 这 两 种 曲线 在 本 质 
FESH. 








В | 1— р 
1.0 | о=0.01 1.0 
0.9 0.9 
0.8 0.8 
0.7 0.7 
0.6 0.6 
0.5 0.5 
0.4 04 
0.3 0.3 
0.2 02 
0.1 
б н єсс=0.01 
l 
290 295 300 305 310 315 320 + 290 295 300 305 310 315 320 + 
(a) (b) 
Kl 10-9 


抛掷 硬币 若干 次 ,检验 硬币 是 均匀 ( 即 p=0.5) 的 这 一 假设 .我 们 先 作出 如 下 的 限制 ， 
(1) 拒绝 正确 假设 的 概率 至 多 为 0.05. 

(2) 当真 正 的 р 和 0.5 之 差 的 绝对 值 不 小 于 0.1( 即 P20.6 或 p 二 0.4) 时 ,接受 假设 
的 概率 至 多 为 0.05. 

求 所 需 样本 容量 的 最 小 值 , 并 给 出 决策 法 则 . 

解 EF 此 题 指定 了 冒险 犯 第 一 类 和 第 二 类 错误 的 极限 值 .例如 ,限制 (1) 表 示 犯 第 一 类 错误 的 概 
率 至 多 为 a=0.05, 而 限制 (2) 表 示 犯 第 二 类 错误 的 概率 至 多 为 B=0.05, 如 图 10-10 所 示 . 





图 10-10 


М 表示 需要 的 样本 容量 , X 表示 抛掷 入 次 正面 出 现 的 次 数 .如 图 10-10, 我 们 要 求 N, X 使 得 :p=0.5 
时 正 态 曲线 在 


Х-М№ XxX-0.5N X -0.5N 
= 人 (5) 
INpg NXx0.5x0.5 0.5/N 
右 方 的 面积 为 0.025, p = 0.6 时 正 态 曲线 在 
X-Np__X-0.6N__X-06N (б) 
V INpa NXx0.6x0.4 0.49/N 


左 方 的 面积 为 0.05. 
(事实 上 ,应 使 得 (X -0.6N)/(0.49 VN) 和 [(N- X) -0.6N]/(0.49 VN ) 之 间 的 面积 是 
0.05, (6) 式 是 一 个 很 好 的 近似 . ) 由 (5) 式 有 


X —0.5М — 
=1.96 或 Х-0.5№+0. 
0 5 或 0.980 vy N (7) 


由 方程 (6) 


X -0.6N 
= 一 1.645 或 X=0.6N-0. 
0.49 VN 或 6 0.806 / N (8) 





则 由 (7) 和 (8) 式 得 N=318.98. 因 此 样本 容量 至 少 是 319( 即 我 们 至 少 抛掷 硬币 319 次 ). 将 М=319 
代入 (7) 或 (8),X=177. 

当 p=0.5 时 ,有 六 -Np=177--159.5=17.5. 故 采用 如 下 的 决策 法 则 : 

抛掷 硬币 319 次 , 如 果 正 面 出 现 的 次 数 在 159.5 + 17.5 之 间 ( 即 在 142 和 177 之 间 ) 就 接受 假 
设 .否则 就 拒绝 假设 . 


控制 图 


10.16 制造 一 台 机 器 用 以 生产 平均 直径 为 0.574 厘米 ,标准 差 为 0.008 厘米 的 滚珠 轴承 .为 
了 检验 该 机 器 是 否 正常 运作 , 每 隔 2 小 时 抽取 一 个 含 6 个 深 珠 轴承 的 样本 ,记录 下 样 
本 的 平均 直径 . 

(а) 制定 一 个 决策 法 则 以 确保 产品 质量 符合 要 求 . 
(b) 说 明 如 何 作 图 表示 (a) 中 得 到 的 决策 法 则 . 
Ж F (а) 在 99.73% 的 置信 水 平 上 , 样本 均值 X 在 Hy 一 3oz 和 和 н + Зву 22 18] 9 u – Зв/ / МЯ 
и + Зо/ / №2 (В|. [М и = 0.574, о = 0.008, N =6, 所 以 在 99.73% 的 置信 水 平 上 ,样本 均值 文 应 在 
0.574 -0.024M6 和 10.574+ 0.024 人 6 之 间或 0.564 和 0.584 之 间 . 因 此 得 到 下 面 的 决策 法 则 ; 

如 果 样 本 均值 在 0.564 厘米 和 0.584 厘米 之 间 , 则 机 器 运作 正常 .否则 , 机 器 就 有 问题 需要 检 
Ж. 
(b) 将 样本 均值 记录 在 均值 图 中 , 如 图 10-11, 称 为 质量 控制 图 .每 抽取 一 个 样本 ,计算 出 它 的 均值 ， 
并 在 图 上 用 一 个 点 表示 .只 要 点 在 下 限 (0.564 厘米 ) 和 上 限 (0.584 厘米 ) 之 间 , 生产 就 在 控制 之 中 . 
如 果 点 跑 出 了 控制 限 之 外 (如 星期 四 抽取 的 第 三 个 样本 ), 那么 就 可 能 发 生 了 什么 问题 ,必须 作 进 一 
步 的 检查 . 上面 指定 的 控制 限 称 为 99.73% 的 置信 限 , 或 简称 为 3c 限 .其 他 的 置信 限 ( 如 99% 或 
9S% 的 置信 限 ) 也 可 类 似 求 得 .要 根据 不 同 的 情况 ,选择 不 同 的 置信 限 . 关 于 控制 图 的 更 详细 的 讨论 
见 第 十 九 童 . 


样本 均值 (cm) 





有 关 均 值 之 差 和 比例 之 差 的 检验 


10.17 在 分 别 有 40 人 和 50 人 的 两 个 班级 进行 测验 . 其 中 , 一 班 的 平均 分 是 74 分 , 标准 差 是 
8 分 ;二 班 的 平均 分 是 78 分 , 标准 差 是 7 分 .在 (a) 0.05, (b) 0.01 的 水 平 下 两 班 成 绩 
是 否 有 显著 区 别 ? 
EO ”时 假定 两 班 学 生 分 别 来 自 于 均值 为 p 和 /ua 的 两 个 总 体 .我 们 要 在 下 面 的 两 个 假设 中 作出 
选择 : 
Не: ж = и, 区别 只 是 出 于 偶然 . 


Ң, : U1 E нэ, 两 者 之 间 有 显著 区 别 . 
在 假设 Ho F, 两 班 来 自 相 同 的 总 体 .样本 均值 之 差 的 均值 和 标准 差分 别 为 


g? g? 8° 7 
ux, =0 орх = м = 40 + 50 = 1:606 
其 中 ,我 们 用 样本 标准 差 作为 о, 和 o, 的 估计 . 则 


= = А-Х: „74578 2.49 





(а) 对 于 双边 检验 ,如 果 = 在 -1.96 到 1.96 之 外 , 则 结果 在 0.05 的 水 平 下 是 显著 的 .因此 我 们 可 以 
断定 在 0.05 的 水 平 下 ,两 班 成 绩 有 显著 差异 , 二 班 成 绩 要 好 于 一 班 . 
(b) 对 于 双边 检验 ,如 果 z 在 -2.58 到 2.58 之 外 , 则 结果 在 0.01 的 水 平 下 是 显著 的 .因此 我 们 可 以 
断定 在 0.01 的 水 平 下 ,两 班 成 绩 没 有 显著 差异 . 

因为 结果 在 0.05 的 水 平 下 显著 ,但 在 0.01 的 水 平 下 不 显著 , 所 以 我 们 可 断定 结果 可 能 显著 ( 根 
据 习 题 10.5 的 结尾 所 用 的 术语 ). 

10.18 菜 大 学 参加 运动 会 的 50 名 男生 的 平均 身高 是 68.2 英寸 , 标准 差 是 2.5 英寸 .其 他 50 
名 男生 的 平均 身高 是 67.5 英寸 ,标准 差 是 2.8 英寸 . 检验 假设 : 参加 运动 会 的 男生 的 
平均 身高 大 于 其 他 男生 的 平均 身高 . 

М Р 我们 必须 在 下 面 的 两 个 假设 中 作出 选择 . 
Ну: = иу, 两 个 平均 身高 之 间 没 有 区 别 . 


Hiiu > pz2, 第 一 组 人 的 平均 身高 大 于 第 二 组 人 的 平均 身高 . 
在 假设 Н 下 有 


2 2 2 2 
— а [1,952 _ [2.55 2.8 _ 
HR TO х= үм +, = s0 50 = 0.53 


其 中 , 我们 用 样本 标准 差 估 计 о, 和 oz. N 


—. 


Xı- X 68.2 – 67.5 
es р 03 = 132 
用 显著 性 水 平 为 0.05 的 单 边 检验 ,如 果 z 分 数 大 于 1.645 就 拒绝 Ho. 所 以 在 这 个 水 平 上 我们 
不 能 拒绝 假设 Ho. 
但 是 ,要 注意 的 是 :如 果 我 们 愿意 冒险 使 犯 第 一 类 错误 的 概率 是 0.10( 即 10 次 中 有 1 次 机 会 ) 
则 在 0.10 的 水 平 上 要 拒绝 假设 H. 


10.19 在 习题 10.18 中 , 如 果 观 测 到 的 平均 身高 的 差异 是 0.7 英寸 , 为 了 保证 这 个 差异 在 (a) 
0.05, (b) 0.01 的 水 平 下 是 显著 的 ,两 个 样本 的 容量 应 该 增加 多 少 ? 
解 ке 假设 每 一 个 样本 的 容量 是 N .在 假设 Н, 下 有 


сї 
+ 


__ 0, a JŽ 2 JaSt. [14.09 _ 3.75 
"X-X, XA1-X, N N N М Е УМ 


оу 7, 3.75/ S/N 3.75 


(а) 当 0.7 V №/3.75 至 少 为 1.645 时 ， 观测 到 的 差异 在 0.05 的 水 平 下 是 显著 的 .所 以 М 至 少 是 
78. 因 此 ,每 一 个 样本 的 容量 至 少 要 增加 78- 50=28. 
另 解 


0.7 V N 


зу > 1.645, VN > 7901.045 SN в в ылу даў м 7в 





(b) ШЖ 


0.7 у 3.75 x 2. 
3 ys 222.33,/ № > 928 уу, > 12.5, N >> 156.3 $ N >> 157 


则 观测 到 的 差异 在 0.01 的 水 平 下 是 显著 的 . 因此 ,每 一 个 样本 的 容量 至 少 要 增加 157- 50-107. 
10.20 A 组 和 B 组 各 包含 100 个 病人 .A 组 人 使 用 了 一 种 血清 ,而 B 组 人 没有 ( 称 为 控制 ). 





10.21 


10.22 


除 A 组 人 多 使 用 该 种 血清 外 ,两 组 人 都 进行 了 同样 的 治疗 ,结果 A 组 和 B 组 中 各 有 
75 人 和 65 ЛВ. (а) 0.01,(b) 0.05, (с) 0.10 的 显著 性 水 平 上 ,检验 假设 :血清 
ЖЯ ҖЕ]. 
# кє рр, 分 别 表示 (1) 用 血清 , (2) 没 用 血清 这 两 个 总 体 的 治愈 比例 .我 们 必须 在 下 面 两 个 
假设 中 作出 选择 

Ho: ру = рз, 观测 到 的 差异 只 是 出 于 偶然 ( 即 该 血清 是 元 效 的 ). 

Hi:p1>p;, 该 血清 是 有 效 的 . 
在 假设 Ho 下 


бр -P, 一 pq М, №, 


1 1) 
- [0.70 x 0.30 x | 2 + g) = 0.0648 


其 中 我 们 用 两 个 样本 的 平均 治愈 比例 (75 + 65)/200= 0.70 来 估计 p,qg=1- p=0.30. 则 


_ Pı- Рә 0.750 -0.650 1 54 
0.0648 С 
1 2 


(а) 在 0.01 的 显著 性 水 平 下 用 单 边 检验 , 只 有 当 z 分 数 大 于 2.33 时 才 拒 绝 Ho 因为 z 分 数 仅 有 
1.54, 所 以 我 们 断定 在 这 个 显著 性 水 平 下 ,结果 只 是 出 于 偶然 . 
(b) 在 0.05 的 显著 性 水 平 下 用 单 边 检验 ,只 有 当 z 分 数 大 于 1.645 ВНА Н. 所 以 我 们 断定 在 
这 个 显著 性 水 平 下 ,结果 也 是 出 于 偶然 . 
(с) 如 果 在 0.10 才 显 著 性 水 平 下 用 单 边 检验 ,只 有 当 z 分 数 大 于 1.28 时 才 拒绝 Ho. ERRAT 
满足 ,因此 我 们 断定 在 0.10 的 水 平 下 ,血清 是 有 效 的 . 

注意 , 这些 结 论 都 依赖 于 我 们 在 意 冒 多 大 的 风险 犯错 误 .如 果 结 果 只 是 出 于 偶然 ,而 我 们 断定 
血清 是 有 效 的 (第 一 类 错误 ), 我 们 可 能 会 给 大 量 的 病人 使 用 这 种 血清 而 最 终 会 发 现 血 清 是 无 效 的 ， 
这 并 不 是 我 们 愿意 承担 的 风险 . | 

男 一 方面 , 当 血 清 确 实 有 效 时 我 们 可 能 会 断定 血清 是 无 效 的 (第 二 类 错误 ) о ВЕ у 
险 的 ,尤其 当然 人 处 于 生死 依 关 的 时 候 ， 
如 果 每 组 有 300 个 病人 , A 组 中 有 225 人 治愈, В 组 中 有 195 人 治愈 .求解 习题 10 20. 


E E 此 时 ,两 组 中 病人 治愈 的 比例 分 别 是 225/300 = 0. 750 和 195/300 = 0.650, 和 习题 10.20 
中 一 样 .在 假设 Ho F 
=0 


2 


1 1 
mp = ЕЯ = [0.70 х 0.30 х 5+) = 0.0374 
其 中 ,我 们 用 (225+ 195)/600 = 0.70 估计 >. 


_ Pi- P, 0750-0.650 
T opp 0.0374 720 
1 2 


因为 求 出 的 z 值 大 于 2.33, 我 们 可 以 在 0.01 的 显著 性 水 平 下 拒绝 假设 Ho; 也 就 是 说 ,我 们 可 以 断 
定 该 血清 是 有 效 的 ,而 判断 错误 的 概率 只 有 0.01. 

东 果 表明 ,增加 样本 的 容量 可 以 提高 决策 的 可 信和 度 .但 是 ,在 许多 情况 下 增加 样本 的 容量 并 不 可 行 。 
此 时 ,我 们 就 不 得 不 根据 现 有 的 信息 作出 决策 , 而 作出 错误 决策 的 风险 要 更 大 

从 A 区 和 B 区 中 分 别 选取 300 人 和 200 人 作 调 查 ， 发 现 支持 某 位 候选 人 的 比例 分 别 
为 56% 和 48% .在 0.05 的 显著 性 水 平 下 检验 假设 ; (а) 两 个 区 之 间 有 差异 , (b) 此 候 
选 人 在 A 区 更 受 拥护 . 

М F p Hp 分别 表示 A 区 和 8B 区 所 有 选举 人 中 支持 该 候选 人 的 比例 .在 假设 Ho: фу = р» 
下 ,我们 有 


FP -P 


o 
Гут I L] - 0.0456 
dp p, = мі N, + ча = (10.528 х 0.472 х (55; +] =0 


其 中 ,我 们 分 别 用 (0.56x300+0.48x200)/500=0.528 和 1-0.528=0.472 估计 请 和 5. 则 


(а) 如 果 我 们 要 判定 两 个 区 之 间 是 否 有 差异 ,我 们 只 要 在 Но: p= p M Hp р, 中 作出 选择 ,这 
是 一 个 双边 检验 .用 显著 性 水 平 为 0.05 的 双边 检验 , ШЖ z 1ТЕ — 1.96 到 1.96 之 外 ,我 们 就 拒绝 
Но. х= 在 区 间 内 ,所 以 在 此 水 平 下 我 们 不 能 拒绝 Но, 也 就 是 说 ,两 个 区 之 间 没 有 显著 差异 . 

(b) 如 果 我 们 必须 判定 此 候选 人 在 A 区 是 否 更 受 拥护 ,我 们 就 要 在 Ho: ру = р 和 日 |: pi> p PE 
出 选择 ,这 是 一 个 单 边 检验 .用 显著 性 水 平 为 0.05 的 单 边 检验 ,如果 = 大 于 1.645, 我们 就 拒绝 Ho. 
因此 ,我 们 在 此 水 平 上 拒绝 假设 Но, 该 候选 人 在 A 区 更 受 拥护 ， 


关于 二 项 分 布 的 检验 


10.23 老师 给 出 了 10 道 是 非 题 考 学 生 . 为 了 检验 学 生 是 否 在 猜 答案 , 老师 采用 了 下 面 的 决策 
法 则 ， 
如 采 答 对 了 7 道 题 或 7 道 题 以 上 ,学 生 就 不 是 全 赁 猜测 . 
如 采 答 对 的 题目 少 于 七 道 题 ,学 生 就 是 在 猜 答案 . 
求 该 决策 法 则 犯 第 一 类 错误 的 概率 . 


10 
解 ағ p 表示 答对 一 是 的 概率 .10 题 中 答对 X 是 的 概率 是 | 


=0.5 的 假设 下 ( 即 学 生 全 和 赁 猪 测 ), 有 
P( 答 对 7 道 题 或 了 7 道 题 以 上 ) = P( 答 对 7 道 题 ) + P( 答 对 8 道 题 ) 
r 卫 (答对 9 道 题 ) + 已 (答对 10 道 题 ) 


10|11 工 1711L13 [10\, 1\8, 113 
-| (4) “о >) 
10 1111: 101 1\1 
ЕЕ | 2 | ЕЗ 
= 0.1719 
所 以 当 学 生 确实 在 猜 答案 时 ,断定 他 没有 猜 的 概率 是 0.1719. 这 就 是 犯 第 一 类 错误 的 概率 ， 
10.24 在 习题 10.23 中 , 求 当 p =0.7 时 接受 假设 p =0.5 的 概率 . 
解 eF 在 假设 :p=0.7 下 
P( 管 对 少 于 7 道 题 ) =1 - POSI 7 道 题 或 7 道 题 以 上 ) 


pxq”“*, 其 中 g=1-p. 则 在 p 





10 
<1- [| on оз 





10 
| -0.78 -0.32 
8 


н ° 0.7 | 
19 
= 0.3504 


10.25 在 习题 10.23 9, R4 (a) p=0.6, (b) p =0.8, (с)р= 0.9, (4) p=0.4, (e) p=0.3, 
(f) p=0.2,(g)p=0.1 时 接受 假设 p=0.5 的 概率 . 








表 10.4 











0.945 | 0.828 | 0.618 | 0.350 0.121 


© EF (а) 如果 p=0.6, A 


要 求 的 概率 =1 - LP( 答 对 7 道 题 ) + P( 管 对 8 道 题 ) 
+ P( 管 对 9 道 题 ) + PX 10 ЕТУ] 





10 
-1- [1] -0.6-0.8 + | -0.6 -0.4 
7 8 


+ 








1 10 
| .0.6 0.4 |- о.в® |= 0.618 
9 10 


(b) 到 (sg) 的 结果 可 类 似 得 到 , 相应 的 值 列 在 了 表 10.4 中 .注意 ,在 表 10.4 中 , 求 得 的 概率 用 8 表示 
( 犯 第 二 类 错误 的 概率 ), 则 p=0.5 时 8=1-0.1719=0.8281( 见 习题 10.23), p=0.7 时 的 8 值 见 
习题 10.24. 

10.26 作 习 题 10.25 F p Xt p 的 图 形 ,并 由 此 作出 习题 10.23 中 决策 法 则 的 OC 曲线 . 
B F 要 作 的 图 形 如 图 10-12. 注 意 ,和 习题 10.14 中 的 OC 曲线 类 似 , 如 果 我 们 作出 了 1 - 8 对 


p 的 图 形 , 就 得 到 了 决策 法 则 的 功效 曲线 .图 形 说 明 当真 正 的 p 志 0.4 或 ›;>0.8 时 ,给 定 的 决策 法 
则 对 拒绝 假设 p= 0.5 是 有 效 的 . 


В 
1.0 
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0.7 
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0.5 
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图 10-12 


10.27 抛掷 一 枚 硬币 6 次 ,每 次 都 出 现 正 面 . 我 们 能 否 分 别 用 单 边 检验 和 双边 检验 在 (al) 
0.05, (b) 0.01 的 显著 性 水 平 下 渐 定 硬币 不 是 均匀 的 ? 


Ж F 2 表示 抛掷 硬币 1 次 正面 出 现 的 概率 .在 Ho:p=0.5( 即 硬币 是 均匀 的 ) 的 假设 下 


Р(Х) = РОЙ ВТ 6 次 有 XX 次 出 现 正面 ) = $ (4) Де - И ‚1. 


Je oa yi ja Jo ; 1 6 15 20 15 6.1 Ф 
则 工 次 ,2 六 3 次 ,4 次 ,5 次 和 6 次 出 现 正面 的 概率 分 别 是 54，54，54， Єт, єт, ооа, ДЖА 
图 为 图 10-13. 





10.28 


. 1 
我 们 要 在 Но: p=0.5 和 Hi:p>0.5 中 作出 选择 .因为 P(6 次 出 现 正面 )= 可 = 0.01562, Р(5 


次 或 6 次 出 现 正 面 ) = s + 4 = 0.1094, 所 以 我 们 可 以 在 0.05 的 水 平 下 拒绝 Ho, 但 不 可 以 在 0.01 的 
水 平 上 拒绝 Ho( 即 观测 到 的 结果 在 0.05 的 水 平 下 是 显著 的 ,但 在 0.01 的 水 平 下 不 显著 ). 
双边 检验 : 

我 们 要 在 Ho: p=0.5 和 Hi: p#0.5 中 作出 选择 .因为 P(0 次 或 6 次 出 现 正面 )= 二 + 二 = 
0.03125, 所 以 我 们 可 以 在 0.05 的 水 平 下 拒绝 Ho, 但 不 可 以 在 0.01 的 水 平 下 拒绝 Ho. 
WRA 5 次 出 现 正 面 ,求解 习题 10.27. 


EO 2 单 边 检验 ;因为 


, _6 1 _ 7 _ 
Р(5 次 或 6 次 出 现 正面 ) = 54 + ы © ы = 0.1094, 
所 以 我 们 不 能 在 0.05 或 0.01 的 水 平 下 拒绝 Ho. 
双边 检验 ;因为 
P(0 次 或 1 次 或 5 次 或 6 次 出 现 正 面 ) = 2 x 2 = 0.2188, 

所 以 我 们 不 能 在 0.05 或 0.01 的 水 平 下 拒绝 Ho. 

补充 习题 

用 正 态 分 布 检验 均值 和 比例 


10.29 


10.30 


10.31 


10.32 


10.33 
10.34 


10.35 


10.36 


10.37 


10.38 
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个 球 ,并 记 下 它们 的 颜色 .采用 如 下 的 决策 法 则 . 

如 果 抽 到 了 28 至 36 个 红 球 则 接受 假设 .否则 拒绝 假设 ，， 

(а) 求 拒 绝 了 正确 假设 的 概率 . 

(b) 画图 表示 决策 法 则 和 (a) 中 得 到 的 结果 ， 

(a) 在 习题 10.29 中 , 如 要 使 拒绝 了 正确 假设 的 概率 不 大 于 0.01( 即 显著 性 水 平 为 0.01), 应 采用 何 种 
决策 法 则 ? 

(b) 接受 假设 的 显著 性 水 平 是 多 少 ? 

(с) 如 果 采 用 0.05 的 显著 性 水 平 ,应 有 何 种 决策 法 则 ? 

假设 在 习题 10.29 中 要 检验 红 球 比例 大 于 蓝 球 这 一 -假设 . 

(а) 零 假设 和 备 择 假 设 各 是 什么 ? 

(b) 采用 单 边 检验 还 是 双边 检验 ? 为 什么 ? 

(с) 如 果 采 用 0.05 的 显著 性 水 平 ,应 有 何 种 决策 法 则 ? 

(d) ЖЖЖ 0.01 的 显著 性 水 平 ,应 有 何 种 决策 法 则 ? 

96—87 100 次 ,点 数 和 为 7 出 现 了 23 次 . 当 显 著 性 水 平 为 0.05 时 ， 分 别 用 (a) 双边 检验 , (b) 
单 边 检验 检验 山子 是 均匀 的 ( 即 没 有 负重 ) 这 一 假设 .你 认为 采用 哪 一 种 检验 更 好 ? 请 说 明理 由 . 

如 显著 性 水 平 为 0.01, 求 解 习题 10.32. 

茶 制造 商 声 称 他 向 一 家 工厂 提供 的 设备 中 至 少 有 95% 符 合 规格 .从 设备 中 提取 一 个 包含 200 个 零件 
的 样本 ,发 现 其 中 有 18 个 次 品 .在 (a) 0.01, (Ь) 0.05 的 显著 性 水 平 下 判断 他 的 声明 是 否 可 信 . 

一 段 时 间 以 来 ,某所 大 学 物理 成 绩 为 A 的 百分比 为 10% . 某 一 学 期 300 名 学 生 中 有 40 人 得 A, 在 (a) 
0.05,(Ь) 0.01 的 水 平 下 检验 这 一 结果 的 显著 性 . 

菜 一 品牌 丝线 的 平均 拉 断 力 为 9.72 ЖН], 标准 差 为 1.40 ЖН], 某 个 含有 36 根 线 的 样品 本 的 平均 拉 
断 力 为 8.93 т]. ИЕЛЕ (а) 0.05, (b) 0.01 的 显著 性 水 平 下 断定 丝线 是 次 品 ? 

不 同学 校 的 许多 学 生 接受 了 一 项 测验 ,平均 分 为 74.5 分 ,标准 差 为 8.0 分 .其 中 一 所 学 校 有 200 名 学 
生 参 加 了 考试 ,平均 分 为 75.9 分 ,在 0.05 的 水 平 下 分 别 用 (a) 单 边 检验 , (b) 双边 检验 讨论 这 一 结果 
的 显著 性 ,并 说 明 由 此 检验 得 到 的 结论 . 

如 果 显 著 性 水 平 是 0.01, 求解 习题 10.37. 


OC 曲线 


10.39 参见 习题 10.29. 当 红 球 的 真正 比例 是 (a)0.6,(b) 0.7, (с) 0.8,(d) 0.9, (е)0.3 IF, 527. EREE 
例 相 等 这 一 假设 的 概率 . 

10.40 Y3 10.39 的 (a) 2 Хр, (b)i- pp р 的 图 形 .分 别 把 红 球 和 蓝 球 类 比 于 硬币 的 正面 和 反面 ,将 此 
图 和 习题 10.12 的 图 相 比 较 . 

10.41 (a) 如 果 检 验 400 条 绳子 ,求解 习题 10.13 和 10.14. 
(b) 当 样 本 容量 变 大 时 ,关于 犯 第 二 类 错误 的 风险 , 你 能 得 出 什么 结论 ? 

10.42 根据 习题 10.31 作出 (a) OC 曲线 , (b) 功效 曲线 . 并 和 习题 10.14 中 的 曲线 相 比 较 . 


质量 控制 图 


10.43 某 工 厂 生 产 的 一 种 品牌 的 丝线 的 平均 拉 断 力 为 8.64 痊 司 ,标准 差 为 1.28 次 司 .为 了 判断 产品 是 否 符 
合 标 准 , 每 隔 3 小 时 抽取 16 根 丝线 , 记 下 它们 的 平均 拉 断 力 . 在 质量 控制 图 上 记录 (a) 99.73% (或 
Зо), (b) 99%, (с) 95% 的 控制 限 ,并 解释 其 应 用 . 

10.44 茶 公 司 生 产 的 螺栓 中 大 约 有 3% 是 次 品 .为 了 保证 产品 的 质量 , 每 隔 4 小 时 抽取 一 个 含有 200 个 螺栓 
的 样本 . 求 每 个 样本 次 品 数 的 (a) 99%, (Ь) 95% 的 控制 限 . 注 意 本 题 只 需 用 到 控制 上 限 . 


有 关 均 值 之 差 和 比例 之 差 的 检验 


10.45 A 工厂 生产 的 100 个 灯泡 的 平均 寿命 为 1190 小 时 ,标准 差 为 90 小 时 .B 工厂 生产 的 75 个 灯泡 的 平 
均 寿命 是 1230 小 时 , 标准 差 是 120 小 时 . 在 (а) 0.05, (b) 0.01 的 显著 性 水 平 下 判断 两 种 灯泡 的 平 
均 寿 命 是 否 有 差异 ? 

10.46 在 习题 10.45 中 ,在 (a) 0.05, (Ъ) 0.01 的 显著 性 水 平 下 检验 B 工厂 生产 的 灯泡 优 于 A 工厂 生产 的 灯 
泡 这 一 假设 .说 明 这 题 与 上 题 结 果 的 差异 . 这 题 结果 是 否 与 上 题 结 果 相 矛盾 ? 

10.47 一 所 中 学 进行 拼写 测验 , 32 个 男生 的 平均 分 是 72 分 ,标准 差 是 8 分 .36 个 女生 的 平均 分 是 75 分. 标 
准 差 是 6 分 .在 (a) 0.05, (b) 0.01 的 显著 性 水 平 下 检验 假设 ;女生 的 拼写 能 力 强 于 男生 、 

10.48 为 了 检验 一 种 新 农药 对 小 麦 的 产量 是 否 有 影响 , 将 一 块 地 分 成 面积 相等 的 60 块 ,每 块 地 的 土壤 质量 
及 光照 条 件 等 均 相 同 . 对 其 中 30 块 地 用 新 农药 , 另 30 块 地 用 旧 农 药 .用 新 农药 的 地 上 的 小 麦 平均 产 
BE 18.2 蒲式耳 ,标准 差 是 0.63 蒲式耳 .用 旧 农 药 的 地 上 的 小 麦 平均 产量 是 17.8 薄 式 耳 ， 标准 差 是 
0.54 蒲式耳 . 在 (a) 0.05, (b)0.01 的 显著 性 水 平 下 检验 假设 新 农药 优 于 旧 农 药 . 

10.49 А як 7 200 个 螺栓 样品 中 有 19 个 次 品 ,B 机 器 生产 的 100 个 螺栓 样品 有 5 个 次 品 .在 0.05 的 
显著 性 水 平 下 检验 (a) 两 台 机 器 所 生产 的 产品 质量 有 差异 , (b)B 机 器 生产 的 产品 质量 优 于 4 机 器 
的 . 

10.50 A 和 B 两 个 锡 子 里 装 有 等 量 的 球 ， 但 是 每 个 鲍 子 里 红 球 与 白 球 的 比例 未 知 .从 每 个 铅 子 里 有 放 回 地 
抽取 50 个 球 ,发 现 从 A 把 中 抽 到 32 个 红 球 , 从 В 经 中 抽 到 23 个 红 球 .在 0.05 的 显著 性 水 平 下 检验 
(а) 两 个 负 子 里 红 球 的 比例 相同 , (b) АЖ ШТ ЕЕЕ в 8. 


关于 二 项 分 布 的 检验 


10.51 参见 习题 10.23, 问 学 生 至 少 应 答对 多 少 题 才 能 使 老师 在 (a) 0.05, (b) 0.01, (с) 0.001, (4) 0.06 的 
PEEKE РКЕ Ж АЕ ЕСИЕТ ЭБИИ ДЕШ ЕЕ ШЖ. 

10.52 ”类似 于 习题 10.10, 为 习题 10.24 作 图 . | 

10.53 如 果 将 习题 10.23 决策 中 的 7 换 作 8, 求 解 习题 10.23 #15 10.25. 

10.54 йй - 枚 硬币 8 次 有 7 次 出 现 正面 .我 们 能 否 在 (a) 0.05, (Ь) 0.10, (с) 0.01 的 显著 性 水 平 下 拒绝 硬 
币 是 均匀 的 这 一 假设 ? 用 双边 检验 来 判定 . 

10.55 用 单 边 检验 解 习题 10.54. 

10.56 ”如果 硬币 的 正面 出 现 8 次 ,求解 习题 10. 54. 

10.57 ”如果 硬币 的 正面 出 现 6 次 ,求解 习题 10. 54 

10.58 一 个 总 子 中 有 大 量 的 红 球 和 白 球 .从 中 随机 抽取 8 个 球 , 其 中 有 6 TARRA 2 个 红 球 .请 用 适当 的 检 
验方 法 和 显著 性 水 平 讨论 镀 子 中 红 球 和 白 球 的 比例 . 

10.59 ”讨论 如 何 用 抽样 理论 来 调查 湖泊 里 不 同 种 类 色 的 比例 . 


第 十 一 章 人 小 样本 理论 


小 样本 


在 前 面 的 章节 中 ,我 们 经 常用 到 这 样 一 个 事实 , 即 当 样本 容量 N >30 时 ,我 们 称 之 为 大 样 
Ж, 其 中 统计 量 的 抽样 分 布 近似 为 正 态 分布 , HEE N 的 增 大 , 越 来 越 接近 正念 分 布 . 当 样 本 
容量 N<30 时 , 我 们 称 之 为 小 样本 ,此 时 的 抽样 分 布 不 再 能 用 正 态 分 布 来 近似 , 且 随 着 N 的 
减少 , 与 正 态 分 布 的 差别 就 越 来 越 大 , 因此 对 小 样本 进行 适当 的 修正 是 必要 的 . 

对 小 样本 统计 量 的 抽样 分 布 的 研究 称 之 为 小 样本 理论 .然而 , 因 所 得 结论 不 仅 适合 小 样本 
问题 ,而且 也 同样 适合 大 样本 问题 , 故 有 时 称 之 为 精确 抽样 理论 会 更 贴切 一 些 .在 本 章 中 ,我 们 
讨论 了 三 类 重要 的 分 布 : 学 生 1 分 布 , x 分布 和 下 分 布 . 


t 分 布 
我 们 定义 统计 量 Е Е 
Х-и 1 Х-и 
t= > JN -1 JTN (1) 
它 是 模仿 统计 量 « 给 出 的 , 其 中 
o/ УМ 


如 宁 我 们 考虑 一 个 样本 容量 为 N 的 取 自 均值 为 y 的 正 态 总 体 ( 或 渐 近 正 态 总 体 ) 的 样本 ， 
对 每 一 样本 ,利用 其 样本 均值 X 和 样本 标准 差 ;( 或 ;) 按 式 (1) 来 计算 t 值 , 则 对 с 的 抽样 分 布 
就 可 以 获得 ( 见 图 11-1). 这 个 分 布 可 以 由 下 式 给 出 : 


Yo Yo 


12 \М? 一 ‚2 (у-1)/2 
2) 1 +E] 
у 


Ү = (2) 


N-1 





图 11-1 各 种 v 值 下 的 1 分 布 


其 中 Yo 是 依赖 于 N 的 常量 , 使 得 曲线 以 下 的 总 面积 等 于 1, 常量 vy = N -1 称 之 为 自由 度 (， 
是 希腊 字母 )， 

分 布 (2) 被 其 发 现 者 W.S. Gosset 称 之 为 学 生 分 布 或 上 分布 . 因 他 曾 在 20 世纪 早期 以 笔 
名 “学 生 " 发 表 作 品 而 得 名 . 

当 v EN 很 大 时 (当然 №2230), 曲线 (2) 非 常 近似 于 标准 正 态 曲 线 
1 12 


е 
V 2л 





Y = 
如 图 11-1 中 所 示 ， 


置信 区 间 
正如 我 们 在 第 九 章 中 所 讨论 的 正 态 分 布 一 样 ,利用 附录 畦 中 :分 布 表 ,我 们 可 以 确定 1 分 
布 的 95%,99% 或 其 他 置信 水 平 的 置信 区 间 , 由 此 可 以 在 指定 的 置信 限 中 估计 总 体 均 值 и. 
例如 ， 设 一 i0 o7s 和 to.97s5 所 对 应 的 t (Ё, 使 得 ( – оо, – 10.975) (20975, + о): 分布 图 中 
各 占 曲 线 下 总 面积 的 2.5% ,那么 上 的 9$% 置 信 区 间 是 


— £0.975 < X-u JN — 1 < го (3) 


从 (3) 式 可 佑 计 得 总 体 均值 w 的 95% 置信 区 间 为 


X- £0.975 == < р < Х + 10.975 == (4) 
注意 , го o7s 代 表 上 分布 的 97.5 百 分 位 数 ， to.025 = 一 to 9751632 2.5 百 分 位 数 . 
一 般 来 讲 , 我 们 可 以 用 式 


5 


(5) 
№- 1 
来 表示 总 体 均值 的 置信 限 , HPAI о, 称 之 为 临界 值 . 它们 依赖 于 置信 水 平 及 样本 容量 , 可 以 
在 附录 正中 查 到 ， 

我 们 用 第 九 章 置 信 限 (入 + zz/ VN) 和 (5) 式 作 比 较 , 可 以 发 现 对 小 样本 情形 ,我 们 用 е, 
代替 z., 用 VN/CN 0) =з Ко, Ж s Жо 的 样本 估计 值 . 随 着 N 的 增加 , 两 种 估计 都 趋 
于 一 致 
假设 检验 和 显著 性 检验 


我 们 在 第 十 章 中 所 讨论 的 假设 检验 和 显著 性 检验 , 或 决策 规则 将 很 容易 推广 到 小 样本 的 
问题 中 , 其 惟一 的 区 别 就 是 用 + 值 或 1 统计 量 代替 z 值 或 zx 统计 量 . 





六 +t 


1. 均 值 | 
为 检验 假设 Ho НАЖАВ y 的 正 态 总 体 , 我 们 用 tA: 统计 量 ) 
t = А8 лт = Ха NN (6) 
来 进行 检验 , 其 中 X 是 样本 容量 为 N 的 样本 均值 .这 类 似 于 在 大 样本 问题 中 用 > 值 
„X-a 
o/ УМ 


来 进行 检验 , 只 是 在 (6) 式 中 用 ;= /N/(N-Ds 代替 了 > {НЧ о. EKIEF 。 服从 正 态 
分 布 ,而 : 服从 学 生 分 布 . 随 着 N 的 增加 ,它们 将 趋 于 一 致 


2. 均值 之 差 


假设 样本 容量 为 N; 和 Na 的 两 个 随机 样本 分 别 取 自 标准 差 相 等 ( 即 01 = 02) 的 两 个 正 态 
总 体 ,再 假设 这 两 样本 的 均值 和 标准 差分 别 为 X M Х, Жз 和 我们 用 ， 值 来 检验 假设 
Ho: 样 本 取 自 同一 总 体 ( 即 L1= H2 01= 02), 其 中 


t= O X-X% __ с = Nisi + №55 (7) 
в J1/N;ı + 1/N, Y Ni +N, -2 
t 服从 自由 度 为 = Ni + №, - 2 的 学 生 分 布 . (7) 式 类 似 于 第 十 章 (2) 式 中 的 > 值 , 只 是 其 
中 5Gl=o2=co, 用 加 权 平 均值 


(Ni -li+(CN 1)52 №52 + №52 
(№ = 1) + (№, – 1) Ni+N - 2 





来 估计 ot, 其 中 sf 和 3 分 别 是 of 和 o3 的 无 偏 估计 . 


х 分 布 
设 统计 量 
» Nè (Х,- Х)2 + (Х,- X) + (ХХ) 
х = с? (8) 


其 中 X 是 希腊 字母 , 读 作 “ 卡 ”, у, ЖИНЕЛ”. 
如 采 我 们 考虑 取 自 标准 差 为 о 的 正 态 总 体 的 容量 为 N 的 样本 , 对 每 一 样本 , 我 们 计算 其 
Хх 值 , 则 x 的 抽样 分 布 即 可 获得 .这 个 分 布 我 们 称 之 为 x? 分 布 .该 分 布 由 下 式 给 出 ， 


2 1(,-2) -1,2 ,一 人 -1,2 
Y = Yoly)? е 2% = Yoy е 21 (9) 
其 中 ,= NM-1 是 自由 度 , Yo 是 依赖 于 ， 的 常量 , 使 得 曲线 下 总 面积 为 1. 对 应 不 同 的 vy 值 有 
不 同 的 x“ 曲线 图 ( 见 图 11-2), 其 中 Y 在 x ”=v 一 2(v 之 2) 时 取 最 大 值 . 


Y 





图 11-2 各 种 vy 值 的 x 分 布 


x 的 置信 区 间 

正如 前 面 对 正 态 分 布 和 上 上 分布 所 讨论 的 一 样 , ЖЕ Б Ж] ШЕ ЖҮ 中 的 y? 分 布 表 确定 
ү? 的 95%,99% 或 其 他 置信 水 平 的 置信 限 或 置信 区 间 . 下 面 我 们 根据 样本 标准 差 5, 在 一 特定 
置信 限 内 估计 总 体 标准 差 о. 

例如 , 设 xi os 和 yb.o7s 是 ү? 的 使 得 区 间 (0， ХС os) 和 (Xi 975, + оо ) 所 对 应 的 x? 分 布 曲 
线 下 方 的 面积 各 占 总 面积 的 2.5% 的 值 ( 称 为 临界 值 ) 那么 Xx“ 的 95% 和 置信 区 间 为 





N 2 
Х0.025 < 2 < %ô.975 (10) 
由 此 我 们 可 得 o 的 95% 估 计 区 间 为 
s/N сос VN (11) 
X 0.975 X 0.025 


对 其 他 的 置信 区 间 我 们 同样 可 得 ,其 中 уо os 和 yo 9zs 分 别 代 表 y? 分 布 的 2.5 和 97 5 百 分 位 
数 的 平方 根 . 

附录 二 给 出 了 x? 分 布 的 相应 于 自由 度 › 的 百 分 位 数 . 当 узо 时 , /372 /7 一 -1 的 分 
布 接近 于 标准 正 态 分 布 ,因此 当 ,之 30 时 , 我 们 可 以 直接 利用 正 态 分 布 表 来 查 临 界 值 # у? 
和 xp 分 别 表示 x? 和 正 态 分 布 的 第 100p 个 百 分 位 数 ， 我 们 有 


1 
Xp = суб; + /2>»—1)° (12) 


这 种 情形 中 所 得 结论 与 第 八 . 第 九 章 中 所 得 结论 是 一 致 的 . 
在 第 12 章 中 将 有 对 六 分 布 的 更 广泛 的 应 用 ， 


自由 度 


为 了 计算 (1) 式 和 (8) 式 的 统计 量 ,我 们 有 必要 利用 某 些 总 体 参数 和 从 样本 中 所 得 到 的 观 
察 值 .如 果 这 些 参数 是 未 知 的 , 他 们 将 必须 利用 样本 来 估计 . 

统计 量 的 自由 度 (一 般 以 vy 记号 ) 定 义 为 样本 中 独立 观察 值 的 个 数 ( 即 样本 容量 ) N 减 去 
kK, 其 中 К 是 要 由 样本 来 估计 的 总 体 参 数 个 数 , 记 为 ，= МК. 

在 统计 量 (1) 式 中 ,样本 容量 为 N, 由 样本 可 计算 X 和 s*. 但 我 们 要 估计 и 值 ,被 估 参 数 只 
有 u 一 个 ,因此 民 =1, 故 v=N-1. 

在 统计 量 (8) 式 中 ,样本 容量 为 N, 由 样本 可 计算 ;. 但 我 们 要 估计 so 值 ,被 估 参 数 只 有 o 
一 个 ,因此 K=1, 故 v=N-1. 


Е 分 布 


由 前 几 章 可 见 , 有 时 候 知道 某 两 样本 均值 之 差 ХХ, 的 抽样 分 布 在 某 些 应 用 中 是 非 党 
重要 的 .同样 ,我 们 将 需要 知道 某 两 样本 方差 之 差 Si - 52 的 抽样 分 布 .然而 ,事实 已 证 明 这 个 
分 布 的 计算 比较 困难 .因此 ,我 们 将 考虑 比值 S3/ 53, 因为 比值 的 大 或 小 都 表示 了 两 方差 相差 
之 大 , 而 大 比值 接近 1 则 表示 了 两 方差 很 接近 .两 样本 方差 比值 的 抽样 分 布 是 可 以 求 出 的 ,我 
们 称 之 为 下 分布 . 

为 了 更 精确 表示 ,我 们 假设 有 两 个 容量 为 N; 和 М, 分 别 取 自 方差 为 cz 和 o? 的 正 态 (或 
渐 近 正 态 ) 总 体 的 样本 ,我 们 定义 统计 量 
${/вї М\5{/[ (М, - 1)o?] 








p` -AN от] 13 
52/52 7 N S2/[(N: — 1)02] (13) 
其 中 
А №, 52 N-S 
2 _ N1951 2 _ N2953 
з= р = (14) 


则 F 的 抽样 分 布 称 之 为 Fisher 的 F 分 布 ,或 简称 为 Е 分 布 ,其 自由 度 为 v1=N, -1 和风- 
№ - 1. 这 个 分 布 由 下 式 给 出 ; 


{»,/2)—1 
СЕ! 
Y = 一 -一 
(vF 十 yg) 1t) (15) 


其 中 СВТ о, 和 v 的 常数 ,使 得 曲线 下 的 总 面积 为 1. 其 图 形 类 似 于 图 11-3, 但 随 着 v; 
Ж va 的 变化 , 曲线 的 形状 也 发 生 较 大 的 变化 . 


Y 


F 0.95 Ёоо 


图 11-3 


附录 V ЖЕ Му F 分 布 的 百 分 位 数 , 其 中 Fo.% 和 Fo. 分 别 表示 使 得 下 分 布 在 
(Fo.9s, + 00) 和 (Fo оо, + оо ) 内 所 对 应 的 面积 占 总 面积 分 别 为 5%,1% 的 下 分 布 的 百 分 位 数 . 
对 假设 检验 问题 ,它们 代表 了 5% 和 1% 的 显著 性 水 平 的 临界 值 . 由 此 可 确定 ,方差 5: ЖЕШ 


EKF S2. 在 实际 中 ,一 般 选 方差 较 大 的 样本 为 样本 1. 


t 分 布 


习题 及 解答 


自由 度 为 9 的 上 分 布 由 图 11-4 给 出 , 求 蝗 值 使 得 (a) 右 边 阴 影 部 分 面积 为 0.0$, (b) 
总 的 阴影 部 分 面积 为 0.05, (с) 总 的 非 阴 影 部 分 面积 为 0.99, (а) 左边 阴影 部 分 面积 为 
0.01, (е) ғ, 左边 的 面积 为 0.90. 
Е БЕ (а) 若 右 边 阴 影 部 分 面积 为 0.05, 则 1 左边 的 面 
积 为 1 ~0.05=0.95, ti 代表 :分布 的 第 95 个 百 分 位 数 即 
to.95. 由 附录 焉 ,对 应 自由 度 9 和 togs, REI г, 的 值 为 1.83. 
(b) 若 总 阴影 部 分 面积 为 0.05, 则 由 对 称 性 可 知 右 边 阴 影 部 
分 面积 为 0.025. 因 此 1 左边 的 面积 为 1- 0.025 = 0.975. [8] 
(a) 可 由 附录 型, 找 出 г 的 值 为 2.26. 

11-4 (с) 总 的 非 阴 影 部 分 面积 为 0.99, 则 总 阴影 部 分 面积 为 
0.01, 1, 左边 的 面积 为 1 -0.01/2=0.995, M Miz MA t = 3.25. 
(d) 利用 对 称 性 可 知 右边 阴影 部 分 面积 为 0.01, 由 附录 硬 , 可知 оо = 2.82, W t= -2.82. 
(е) ЖШ Ш, ло.» = 1.38, BI 1, = 1.38. 
求 寺 的 临界 值 ,使 с 分 布 的 右 尾 面积 为 0.05, Ж#Н Н у 为 (a) 16, (Ь) 27, (с) 200. 
解 кє 利用 附录 亚 , 可 找到 10 os 的 值 (a)y =16 时 ,zo os=1.75;(b) v=27 Ht, 10 о; = 1.70; (с) „= 
200 时 ,tio%=1.645( 最 后 一 值 可 在 正 态 曲 线 图 中 找到 ,在 附录 下 中, 相应 于 y REFA). 
正人 态 分 布 的 95% 的 交界 值 ( 双 尾 ) 为 + 1.96, 则 相应 的 zt 分 布 的 临界 值 是 多 少 ? 若 (a) ， 
=9, (b) y=20,(c)r = 30, (d) v =60. 
解 F 对 95% 的 临界 值 ( 双 尾 ), 在 图 11-4 中 对 应 的 阴影 部 分 面积 是 0.05, 因此 右 尾 阴影 部 分 面 
积 为 0.025, 相应 的 上 的 临界 值 为 to.97s, 故 所 求 临界 值 为 二 tu 57s. 对 给 定 的 v 值 ,得 相应 的 + toont 
Я: (а) + 2.26, (b) +2.09,(c)+2.04,(d) +2.00. 
对 茶 个 球面 的 直径 ,给 出 了 含有 10 个 测量 值 的 一 个 样本 , 其 均值 X=438 厘米 ,标准 差 
s =0.06 厘米 ,求实 际 直径 的 (a) 95%, (b) 99% 的 置信 限 ， 
解 EF (а) 95% 0 ЖИЫН X + to09s(s/VN-1). 
因为 v“=N-i=1li0-1=9, 可 求 得 io9s=2.26( 见 习题 11.3(a)) .再 将 X=4.38. = 0.06 代入 , В 
得 953% 置 信 限 为 4.38+2.26(0.06/vV10-1)=4.38+0.0452, 即 我 们 有 95% 的 把 握 认 为 直径 的 均值 
处 于 4.335 厘米 与 4.425 厘米 之 间 . 
(b) 99% 置 信 限 为 X+tes(VVN-1). 对 v=9%,r0osg=3.25, 则 9%9% 的 置信 限 为 

4.38 + 3.25(0.06/ V10 = 1) = 4.38 + 0.0650, 

因此 99% 的 置信 区 间 为 (4.315 ЖЖ, 4.445 ШЖ). 
对 25 个 随机 选取 的 工人 记录 其 因 与 工作 有 关 的 腕 肯 综合 症 而 离 岗 的 天 数 , 结果 由 表 
11.1 给 出 . 当 这 些 数据 用 来 对 所 有 与 工作 有 关 的 腕 骨 综 合 症 的 总 体 的 期 望 值 设 立 一 个 
置信 区 间 时 , 必须 有 一 基本 假设 : 即 这 些 总 体 的 离 岗 天 数 是 服从 正 态 分 布 的 . 用 这 些 数 
据 来 检验 正 态 假设 .车 假设 成 立 , 则 设立 u 的 95% 的 置信 区 间 . 
Ж ES 由 Minitab 软件 产生 的 正 态 概率 图 ( 见 图 11- 5) 表 明正 态 性 假设 是 合理 的 , 此 因 一 值 大 于 


0.15.p 一 值 可 用 来 检验 零 假 设 :数据 取 自 正 态 分 布 总 体 .如 果 显 著 性 水 平 为 0.05, 那么 当 pp 一 值 小 于 
0.05 时 才 拒 绝 总 体 分 布 是 正 态 这 个 假设 .由 于 用 Kolmogorov-Smimov 检验 得 到 的 一 值 大 于 0.05, 
因此 我 们 不 能 拒绝 正 态 性 假设 . 








用 Minitab 软件 可 得 到 置信 区 间 . 总 体 均 值 的 9g% 置 信 区 间 为 每 年 27.21 至 33.59 Ж. 
МТВ > tinterval 95% confidence for data іп с! 


Confidence Intervals 


Variable N Mean StDev SE Mean 95.0%CI 


days 25 30.40 7.72 1.54 (27.21,33.59) 


概率 





16 26 36 46 
天 数 
”均值 :304 Kolmogorov-Smimov FÆR% 
标准 差 : 7.72442 0+:0.068 D-:0.046 D:0.068 
N:25 近似 已 - 值 >0.15 


R 11-5 ЕХ 


11.6 一 台 机 需 生 产 厚 度 为 0.050 英寸 的 垫圈 . 为 确定 该 机 器 是 否 仍 正常 运转 , 选 了 10 个 热 
Е, 测 得 其 厚度 均值 为 0.053 英寸 , 标准 差 为 0.003 英寸 . 在 显著 性 水 平 (a) 0.05 和 (b) 
0.01 下 来 检验 假设 .机 器 仍 正常 运转 . 
E F 我 们 将 在 下 列 假设 中 做 出 选择 ， 
Ho:w=0.050, 即 机 器 正常 运转 . 
H; : и5©0.050, 即 机 器 不 能 正常 运转 ， 
因此 , 需 用 到 双边 检验 .在 假设 H F, 我 们 有 


X- 0.053 - 0. 
t= А8 Лут = 0930.050 уто = 3.00 


(а) 对 于 显著 性 水 平 为 0.05 的 双边 检验 , 我 们 采用 决策 规则 ， 

者 1 值 处 于 区 间 ( — io ezs, to ws) 之 间 , 则 接受 Но, 否则 拒绝 Ho. 对 自由 度 为 10 -1=9 WE, 
区 则 为 (-2.26,2.26). 央 为 上 =3.00 在 该 区 间 之 外 , 故 在 0.05 水 平 下 拒绝 Ho. 
(b) 对 于 显著 性 水 平 为 0.01 的 双边 检验 , 我 们 采用 决策 规则 . 

P 1 值 处 于 区 间 ( — г, ооз, to 905) 之 间 , 则 接受 Но, 否则 拒绝 Ho. 自由 度 为 9 时 ,该 区 间 为 


(-3.25,3.25). TĄ : =3.00 AZRE Z A, Е 0.01 水 平 下 ,我 们 接受 Ho. 

因为 在 水 平 0.05 时 拒绝 Ho MEKE 0.01 时 接受 Ho, 故我 们 说 该 样本 结论 是 可 能 显著 (见习 
题 10.5 最 后 的 专用 名 词 ). 因 此 有 必要 检查 :下 该 机 器 或 者 至 少 上 再 抽样 检查 -次 . 
一 个 经 营 铁 锤 的 经 理 进 行 了 一 项 检验 : 零 假设 u = 50 美元 相对 于 备 择 假 设 u50 Ж 
元 , 其 中 и 表示 顾客 购买 铁 锤 时 所 付 的 平均 价格 .对 28 个 顾客 的 统计 数据 如 表 11.2 
所 示 . 用 :分布 来 进行 假设 检验 , 设 这 些 数据 选 自 一 服从 正 态 分 布 的 总 体 .此 正 态 假设 
可 由 各 不 同 的 正 态 性 检验 检测 出 来 . Minitab 给 出 了 三 种 不 同 的 止 态 检验 .在 惯用 的 显 
著 性 水 平 a =0.05 下 进行 正 态 性 检验 , 若 正 态 假设 成 立 , 我 们 再 继续 在 显著 性 水 平 a = 
0.05 下 检验 假设 Ho: u = 50 美元 对 H): u #50 美元 . 

















解 ES шщ Minitab 软件 给 出 的 Anderson-Dariing 正 态 性 检验 的 p- = 0.922, Ryan-Joyner 正人 态 性 
检验 的 p -人 和 值 大 于 0.1,Kolmogorov-Smirnov 正 态 性 检验 的 pp 一 信 大 于 0.15. 在 这 三 种 情况 下 , 对 显著 
性 水 平 S% , 都 不 拒绝 数据 来 自 正 态 总 体 这 个 假设 ,这 是 因为 圳 假设 当 且 仅 当 显著 性 水 平 大 于 р й 
时 被 拒绝 .对 每 个 顾客 所 付 的 平均 价格 的 检验 由 Minitab 软件 给 在 下 面 .如 用 经 典 的 检验 假设 的 方 
法 ,那么 当 检验 统计 基 的 绝对 值 大 于 2.05 时 拒绝 零 假 设 .临界 值 2.05 由 自由 度 为 27 的 1 分布 查 得 . 
几经 计算 得 检验 统计 量 的 值 为 18.5, 故我 们 拒绝 零 假 设 , 而 认为 所 付 的 平均 价格 不 是 S0 美元 .如 果 
用 p- 值 来 检验 假设 , 则 因 р – 18 = 0.0000 小 于 显著 性 水 平 0.05, 我 们 也 拒绝 零 假设 ， 

Data Display 

Amount 

66 54 57 62 72 49 92 74 56 

6$ 45 24 52 94 59 76 36 75 

57 45 65 60 36 64 33 50 66 

40 

MTB> TTest 0.0 Amount’; 

SUBC > Alternative 0. 

T-Test of the Mean 


Test of mu = 0.00 vs mu not = 0.00 
Variable N Mean StDev SE Mean T P 


Amount 28 58.07 16.61 3.14 18.50 0.0000 


从 一 个 城市 的 某 个 地 区 所 选 的 16 名 学 生 的 IQ 均值 为 107, 标 准 差 为 10, 而 该 城市 另 一 
地 区 所 选 的 14 名 学 生 的 IQ 均值 为 112, 标准 差 为 8, 则 问 在 显著 性 水 平 为 (a) 0.01 和 
(b) 0.05 下 ,这 两 组 学 生 的 ТО 值 是 否 存在 显著 差异 ? 
解 E 若 令 jy 和 jz 分 别 记 为 两 个 地 区 学 生 的 总 体 JQ 均值 , 则 我 们 将 从 下 面 假设 中 做 出 选择 ， 
Ho: = ио, ЗЕЕ ТО 没 差异 . 
Н,: муз ио, WEEER. 


在 假设 Ho F, 
X, - X, Nis? + Nas% 
t= 一 一 一 一 一 一 一， 其 中 = 一 一 一 一 一 
в у1/Му + 1/М,» ° Ni+ М,-2 


内 此 
С [18 10. T Hx 8 = 9.44, = а TE TG 
(EE ТЕКТ 0.01 下 用 妈 边 检验 , 若 上 值 处 于 区 间 (- toos, ѓо 995) 2E, UHE Н, 否则 拒绝 
Ho. MX A HEN № + Na-2=28 而 言 ,该 区 间 为 (-2.76,2.76), 故 接受 Ho. 
(b) 类 似 于 (a) 可 得 在 水 平 0.05 下 也 接受 Ho. 
由 此 得 出 结论 ,两 组 学 生 的 ТО 值 无 显著 差异 . 

11.9 对 15 名 随机 抽取 的 公立 大 学 学 生 和 10 名 随机 抽取 的 私立 大 学 学 生 , 统计 了 他 们 每 年 
学 费 、 住 宿 、 伙 食 的 开支 情况 , 记录 在 表 11.3 中 .检验 零 假设 :私立 学 生 每 年 的 平均 开支 
比 公 立 学 生 多 1 万 元 , 对 应 的 备 择 假设 :平均 开支 数 相差 不 是 1 万 元 .在 进行 零 假 设 检 
验 之 前 , 先 在 显著 性 水 平 0.05 下 检验 正 态 假设 和 方差 相等 的 假设 


= 1.45 


表 11.3 


私立 大 学 








# е 对 公立 大 学 的 数据 ,由 Minitab 软件 给 出 的 Anderson-Darling 正 态 性 检验 显示 在 图 11-6 Ф. 
Ё pp 一 值 (0.432) 不 小 于 显著 性 水 平 (0.05), 故 不 拒绝 正 态 性 假设 . 





4 3 6 7 8 9 10 11 


均值 :7.56667 公立 Anderson-Darling 正 态 性 检验 
标准 差 : 2.41681 0.346 
N:15 Pp- 值 0.432 


图 11-6 正 态 概率 图 


类 似 地 对 私立 大 学 的 数据 , Anderson-Darling 正 态 性 检验 的 t- 185 0.394. p - АЖР 0.05, 
对 私立 大 学 的 数据 也 不 拒绝 正 态 性 假设 . Bartlett 和 Levene 的 方差 相等 检验 的 р - 1877910 0.885 和 
0.651, 这 表明 可 认为 两 总 体 方差 相等 .对 这 个 检验 Minitab 输出 如 下 ， 

Homogeneity of Variance 


Bartlett's Test( normal distribution) 


Test Statistic : 0.021 
P- Value : 0.885 
Levene s Test(any continuous distribution ) 


Test Statistic : 0.210 


P- Value : 0.651 
因 均 值 差 的 95% 置信 区 间 包 含 - 10, 因此 在 显著 性 水 平 0.05 下 不 拒绝 零 假设 . 
Row Public Private 

1 4.2 13.0 
2 6.1 18.8 
3 4.9 13.2 
4 8.5 14.4 
5 4.6 17.7 
6 9.1 17.7 
7 7.7 17.6 
8 6.5 19.8 
9 6.2 16.8 
10 10.2 16.1 
11 11.6 
12 10.4 
13 5.0 
l4 10.4 
15 8.1 


MTB > TwoSample95.0 Public’ Private’ ; 
SUBC > Alternative 0; 

SUBC > Pooled. 

Two Sample T-Test and Confidence Interval 


Two sample T for Public vs Private 


N Mean StDev SE Mean 
Public 15 7.57 2.42 0.62 
Private 10 16.51 2.31 0.73 


95%CI for mu Public-mu Private: ( – 10.95, - 6. 94) 
х 分 布 


11.10 上 自由 度 为 5 的 x? 分 布 如 图 11-7 所 示 . 求 相应 的 x 的 临界 值 , 使 得 (а) 右边 阴影 部 分 
面积 为 0.05,(b) 总 阴影 部 分 面积 为 0.05, (с) 左边 阴影 部 分 面积 为 0.10, (4) 右边 阴 
影 部 分 面积 为 0.01. 


R S (а) 若 右边 阴影 部 分 面积 为 0.05, 则 x3 左边 面积 为 1 -0.05=0.95， х5 代表 x? 分 布 的 第 
95 个 百 分 位 数 , 即 уо о. RREN, 对 应 于 自由 度 5 和 Xi os: 可 得 x? 临界 值 为 11.1. 

(b) 因为 分 布 是 非 对 称 的 , 故 对 总 阴影 部 分 
面积 为 0.05 求 临界 值 有 很 多 解 . 例如 , 设 右 边 阴影 
部 分 面积 为 0.04, 则 左边 阴影 面积 为 0.01. 但 是 , 除 
特别 说 明 , 一 般 指 两 边 阴影 面积 是 相等 的 .在 这 里 ， 
即 为 左 、 右 阴影 面积 均 为 0.025. 

рь 者 右边 阴影 面积 为 0.025, 则 同 (a), ШЇ ЖҮН 
х^ x; 得 临界 值 25 = 12.8. 同 样 若 左 边 阴影 面积 为 0.025， 
则 由 附录 四 , 找 对 应 自由 度 5 和 y2 os 的 值 , 即 得 临 
界 值 yf =0.831. 
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(c) x?=1.61. 

(4) х5 = 15.1. 

对 应 自由 度 ， 为 (a) 15, (Ь) 21, (с) 50, y? 的 临界 值 ,使 得 уг 分 布 的 右 侧 尾 面积 为 

0.05. 

解 S 由 附录 ,对 应 于 x8.95, 可 得 临界 值 为 (a) 25.0, v=15;(b) 32.7,v=21;(c) 67.5, = 50. 

对 应 自由 度 为 (a) 9, (b) 28, (с) 40 , 求 y? 的 中 位 数 . 

解 б 由 附录 区 ,对 应 于 Xi.5o, 可 得 中 位 数 为 (a) 8.34, v=9;(b) 27.3,v=28;(c) 39.3,v=40. 
我 们 注意 到 一 个 有 趣 现象 , 即 所 求 中 位 数 很 接近 相应 的 自由 度 .事实 上 ,对 „>10, 其 相应 中 位 

数 等 于 vy -0.7. 

在 一 个 学 校 1000 名 男生 中 随机 选 16 名 男生 , 测 得 他 们 身高 的 标准 差 为 2.40 英寸 . 求 

该 校 所 有 男生 身高 标准 差 的 (a) 95%, (b) 99% 的 置信 和 限 . 

# ES (а) 95% 置信 限 由 s VN/xo9s 和 s VN/xo.02s 给 出 . 

Xİ v=16-1=15, x6.9s 二 27.5( 或 者 x0.9s = 5.24), ур os= 6.26( 或 者 уо 02s = 2.50), Ш 95% 置 信 

限 为 2.40x V16/5.24 #1 2.40 х /16/2.50(Е 1.83 #1 3.84 英寸 ), 因 此 我 们 说 总 体 标准 差 的 95% 

置信 区 间 为 (1.83,3.84). 

(b) 99% 置信 限 由 5 ЛМГ о оо; Ж з VN/xo.o0s 给 出 .类 似 于 (a) 可 得 总 体 标准 差 的 99% 置信 区 间 为 

(1.68, 4.49). 


ХВ (а) = 50, (b) v=100 3R уд о;. 
# E 当 v>30 时, V2- /2› 一 1 的 分 布 非常 接近 标准 正 态 分 布 . 若 令 «„ 表示 标准 正 态 分 布 
的 下 p 分 位 数 , 则 在 很 大 程度 上 , 近似 地 有 : 

/24;-У/2» l= Vx y= „+ Лу 


因此 x= 1-08, + 23 - 1)? 


(а) # у= 50, 1 уф о5= у (20.95+ У2 х 50 -— )2= 241. 64+ /99)2 = 67.2, 185 ЖҮР 
查 值 67.5 非常 接近 . 


(b) Æ v=100, M уг, s= F (zo, 95 + /2х100—1)2= 3-01. 64+ J199)? = 124.0( 实 际 值 =124.3)， 


200 个 电灯 泡 寿 命 的 样本 标准 差 为 100 小 时 , 求 所 有 这 类 电灯 泡 寿 命 的 标准 差 的 (al) 
95%, (Ь) 99% 的 置信 限 . 

E EF 类 似 于 习题 11.14 可 得 x8 ons = 239, у os = 161, X0.995 = 253, 70.005 = 150, 即 yo оз; = 
15.5, Хо.025 = 12.7, Xo 995 = 15.9, уо os=12.2. 再 类 似 于 习题 11.13 可 得 ， 

(а) 总 体 标准 差 95% 的 置信 区 间 为 (91.2,111.3). 

(b) 总 体 标准 差 99% 的 置信 区 间 为 (88.9, 115.9). 

一 轮轴 制造 工 在 制造 过 程 中 必须 保持 轮轴 的 平均 直径 为 5.000 厘米 .此 外 , 为 了 保证 
轮轴 与 轮子 相配 ,直径 的 标准 差 必 须 小 于 或 等 于 0.005 厘米 . 现 抽取 20 个 轮轴 , 它们 
的 直径 由 表 11.4 给 出 . 


表 11.4 








制造 工 希 望 检验 零 假设 ;总体 标 准 差 为 0.005 厘米 ,对 应 的 备 择 假 设 . 总 休 标 准 差 


超过 0.005 ЖЖ. ARTERIK, 则 必须 停止 制造 过 程 , 对 机 器 进行 修理 .在 检验 程 
FP, 我 们 假设 轮轴 直径 是 服从 正 态 分 布 的 .在 显著 水 平 0.05 下 检验 这 个 正 态 假设 ， 
若 该 假设 成 立 ,再 在 0.05 显著 水 平 下 检验 关于 总 体 标准 差 的 零 假 设 ， 

ЯЕ F 类 似 于 Shapiro-Wilk 正 态 性 检验 的 Ryan-Joiner 止 态 性 检验 显示 在 图 11-8, 其 户 - 值 超过 
0.10, 因此 在 显著 性 水 平 0.05 下 不 拒绝 正 态 性 假设 . 








4,995 5.000 5.005 5.010 
均值 : 5.00055 не 正 态 性 的 w 检 验 
标准 差 : 0.0046394 R: 0.9979 
N:20 近似 户 值 :>0.1000 


图 11-8 正 态 概率 图 


对 除数 为 N -1 的 标准 差 , Minitab 软件 计算 结果 如 下 

Data Display 

Diameter 
4.996 5.010 5.006 5.002 5.007 4.998 4.997 
5.004 4.996 5.003 5.002 5.003 5.000 5.005 
5.000 4.999 4.998 4.993 4.992 5.000 

МТВ >standard deviation cl 

Column Standard Deviation 

Standard deviation of Diameter = 0. 0046394 
总 体 标准 差 小 于 或 等 于 0.005 的 检验 即 要 求 我 们 在 下 面 两 个 假设 中 作出 选择 ， 
Ho:c=0.005, 即 观察 结果 纯 属 偶然 . 
Н\:в >0.005, 即 有 很 大 变化 . 

样本 的 у2 值 为 


CN -1)S- 19x0.0046394? 
а? 0.005? 


使 用 单 边 检验 , 对 于 自由 度 为 19 及 显著 性 水 平 为 0.05 如 果 x 的 值 大 于 у2 ss = 30.1, 则 拒绝 

Ho .因此 在 显著 性 水 平 0.05 下 我 们 不 拒绝 H. 
11.17 以 往 , 一 装 有 某 机 器 的 40 RIOR, 其 重量 的 标准 差 为 0.25 ЖБ]. 现 随 机 抽样 20 个 

包 囊 ,其 标准 差 为 0.32 着 司 , 问 在 显著 性 水 平 (a) 0.05, (b) 0.01 下 是 否 有 了 明显 增加 ? 
E S 我 们 必须 在 以 下 假设 中 做 出 选择 . 

Но:с= 0.25 检 司 , 即 观 察 结果 纯 属 偶然 . 

Н\:в >0.25 益 司 , 即 有 明显 变化 . 
其 样本 的 y 值 为 


х? = = 16.4 


F 分 布 
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t 分 布 
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> №2 20х 0.322 
X T a T 0.25 


(а) 用 单 边 检 验 , 在 显著 性 水 平 0.05 F, EE y 值 大 于 xi os, WIE Ho. X A BE у= 20-1 = 
19, xi es=30.1. 因 此 存 0.05 显著 性 水 平 下 ,我 们 必须 拒绝 Ho. 
(b) 用 单 边 检验 , 在 显著 水 平 0.01 下 , 若 样本 y EKF уф w= 36.2, 则 拒绝 Ho. 因 此, 我们 在 0.01 
显著 性 水 平 下 ,支持 日 (或 者 说 接受 Ho). 

由 上 , 我们 得 出 结论 ;可 能 有 增加 , 故 应 该 对 机 器 进行 检测 


= 32.8 


从 两 个 服从 正 态 上 且 方 差 为 16 和 25 的 总 体 中 分 别 抽取 样本 容量 为 9 和 12 的 样本 . 若 
样本 方差 分 别 为 20 和 8, 试 确定 在 显著 性 水 平 (a) 0.05, (b) 0.01 下 , 第 一 个 样本 的 方 
差 征 否 比 第 二 个 样本 方差 明显 偏 大 ? 
解 ”& 对 样本 1 和 样本 2, 有 Ni=9, N=12,0?=16,0o2=25,s?=20，s3=8, 因 此 

в с Sioi МИГОМ -Dol  9x20/[(9-1)x16] _ 4.03 

3/03 М›53/[(М,-1)42] 12 x 8/{(12- 1) х 25] 

(a) F 的 分 子 、 分 母 的 自由 度 分 别 为 =Ni-1l=8, n= N, -1=1l. 从 附录 V 可 以 找到 Ев.95 = 
2.95. 由 于 下 =4.03> Fo.os, 故 得 结论 :在 显著 性 水 平 0.05 F, 样本 1 的 方差 明显 大 于 样本 2 的 方 
差 . 
(b) 对 v1=8,v2=11 由 附录 V ,可 得 Foo=4.74>4.03= 下 ,因此 得 结论 :在 显著 性 水 平 0.01 F, 
样本 1 方差 不 明显 大 于 样本 2 方差. 
从 两 个 服从 正 态 分 布 且 方差 分 别 为 20 和 36 的 总 体 中 分 别 抽 取样 本 容量 为 8 和 10 的 
样本 . 求 样 本 1 方差 大 于 两 们 样本 2 方差 的 概率 . 


解 EF 已 知 Ni=8, Na=10,c?=20,c3=36 故 


852/7 x 20 52 
F= 550720 _ | р; 51 
1052/9 х 36 52 


F 的 分 子 、 分 母 的 自由 度 分 别 为 v1 = № -1=7, 0 = № -1=9. 若 S1 大 于 255, | 
2 
F = 1.85 21 > 1.85 х2 = 3.70 
52 
从 附录 V 和 VY 中 可 知 ;:0.01< P(F>3.70)<0.05. 为 得 更 确切 的 值 , 我 们 必须 有 一 个 下 分 布 的 更 精 
确 的 表 . 


Р 25 


对 一 自由 度 为 15 的: Л, с 的 值 使 得 (a) 1, 右边 的 面积 为 0.01, (b) 2, 左边 的 面积 为 0.95, (с) 
ti 右边 的 面积 为 0.10, (4) ti AAR - r, 左边 的 总 面积 为 0.01, (е) - ti 与 ft1 之 间 的 面积 为 0.95. 
对 自由 度 v X (a) 4, (b) 12, (с) 25, (4) 60, (е) 150, 分 别 求 其 相应 的 1 的 临界 值 , 使 得 该 分 布 的 右 尾 
面积 是 0.01. 

求 : 分布 的 值 1, 使 其 分 别 满足 下 列 条 件 ; 

(а) = г, 57 г 2 ЈН 5 0.90, у= 25. 

(b) – 1 ЖН Я 5 0.025, ,= 20. 

(с) i 右边 与 -ti 左边 的 总 面积 为 0.01,v=5. 

(d) 1, 右边 的 面积 是 0.55, y= 16. 


各 一 变量 U 服从 自由 度 为 10 的 1 分 布 , 求 常数 C, 使 得 ,(a) Р(О>С) =0.05, (Ь) P(- с<0%С) 


= 0.98, (c)P( UKC) =0.20, (4) Р(и2>2С) = 0.90. 


11.24 正 态 分 布 的 99% 临界 值 ( 双 边 ) 为 土 2.S8. 求 相应 ， 分 布 的 临界 值 ,车 (a)v = 4, (Ь) у= 12, (с) v = 25, 


(4), = 30, (е) = 40. 
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取 12 根 纱 线 样品 , 测 基 它 们 的 抗 断 强度 ,可 得 其 均值 为 7.38 克 , 标 准 差 为 1.24 克 , 求 实际 抗 断 强度 
的 (a) 95%, (Ь) 99% HAR. 

假设 大 样本 理论 方法 对 习题 11.25 适用 , 比较 其 所 得 结 

对 5 个 不 同 个 体 测量 他 们 对 某 种 刺激 的 反应 时 间 分 别 为 :0.28 秒 ,0.30 秒 ,0.27 秒 ,0.33 秒 ,0.31 
秒 . 求 实际 反应 时 间 的 (a) 95%, (Ь) 99% 的 置信 限 . 

以 往 某 公 司 生产 的 电灯 泡 的 平均 寿命 为 1120 小 时 ,标准 差 为 125 小 时 , 现 从 一 批 新 生产 的 灯泡 中 抽 
取 8 个 样品 ,得 其 平均 寿命 为 1070 小 时 ,分 别 在 显著 性 水 平 (a) 0.05, (b) 0.01 下 检验 假设 ;灯泡 的 
平均 寿命 没 变 . 

在 问题 11.28 中 ,在 显著 性 水 平 (a) 0.05, (b) 0.01 下 ,检验 零 假 设 :y = 1120 小 时 对 备 择 假设 ;wx < 
1120 小 时 . . 
茶 种 合金 的 生产 说 明 书 上 标明 该 合金 含有 23.2% 铜 .从 该 合金 产品 中 抽取 10 个 样品 , 测 得 其 平均 铜 
含量 为 23.5%, 标准 差 为 0.24% .在 显著 性 水 平 (a) 0.01,(b) 0.05 下 ,是否 可 得 结论 ;产品 满足 说 明 
书 要 求 ? 

在 问题 11.30 中 ,在 显著 性 水 平 (a) 0.01, (b) 0.05 下 检验 假设 :平均 铜 含量 高 于 说 明 中 要 求 . 

一 效率 专家 主张 在 生产 线 上 引进 一 新 型 机 器 , 它 能 较 大 地 减少 生产 所 需 时 间 . 因为 涉及 机 器 维修 费 
用 ,管理 人 员 认 为 ,除非 生产 时 间 至 少 能 降低 8.0%, 否则 不 值得 买 机 器 .6 次 合成 实验 表明 生产 时 间 
降低 了 8.4% .标准 差 为 0.32%, 用 显著 水 平 (a) 0.01, (b) 0.05 下 检验 假设 ,应 该 引进 机 器 

用 商标 A 的 汽油 ,5 辆 同样 的 汽车 在 相同 条 件 下 每 加 仑 平均 行驶 22.6 英里 ,标准 差 为 0.48 英里 . 而 
用 商标 B 的 汽油 , 5 辆 车 平均 行驶 21.4 英里 ,标准 差 为 0.54 英里 .在 显著 性 水 平 0.05 下 , 检验 在 每 
加 仑 汽油 所 行 的 平均 里 程 上 , 商标 A 汽油 比 商标 B 要 好 一 些 . 

两 种 类 型 的 化 学 溶液 A 和 B, 检 验 它 们 的 pH 值 ( 即 溶液 的 酸度 ) .分析 A 型 的 6 个 样品 , 测 得 其 平均 
PH 值 为 7. 52, 标准 差 为 0.024. 分 析 B 型 的 5 个 样品 , 测 得 其 平均 PH 值 为 7.49, 标准 差 为 0.032, 在 
0.05 显著 性 水 平 下 ,确定 两 种 溶液 是 否 具有 不 同 的 pH 值 . 

在 心理 学 考试 中 , 一 个 班 的 12 名 学 生 的 平均 成 绩 为 78, 标准 差 为 6; 而 另 一 个 班 的 15 名 学 生 的 平均 
成 绩 为 74, 标准 差 为 8. 在 显著 性 水 平 0.05 下 判断 第 一 组 学 生 是 否 比 第 二 组 学 生成 绩 好 ? 


х Эњ 
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对 一 目 由 度 为 12 的 x? 分 布 , 求 x? 的 值 ,使 得 (a) y? 右边 面积 为 0.05, (b) х2 左边 的 面积 为 0.99， 
(с) y? 右边 的 面积 为 0.025. 

АВЕ v 为 (a) 8,(Ъ) 19, (с) 28, (4) 40, 求 相应 的 六 的 临界 值 ,使 得 x? 分 布 的 右 尾 面积 为 0.05. 
若 右 尾 面 积 为 0.01, 求 习题 11.37. 

(а) 对 目 由 度 为 v=20 的 x? 分布, 求 x? 和 x3, 使 x? 与 yi 之 间 的 面积 为 0.95, 这 里 假设 у 右边 与 
X2 左边 面积 相等 . 

(b) ИЕН: Ж (а) ЖУЙ уз 右边 与 y? 左边 面积 相等 , 则 Xt 与 * 的 值 不 惟一 . 

ARE U 服从 自由 度 为 ,=7 的 x? 分 布 , 求 好 与 好 使 得 :(a) Р(О> 45) = 0.025, (Ь) P(U< 7?) 
= 0.50, (с) P(xi< 0< у?) = 0.90. 

某 公 司 制 造 的 10 个 电灯 泡 的 寿命 的 标准 差 为 120 小 时 , 求 该 公司 所 有 电灯 泡 寿命 的 标准 差 (a) 
95%, (Ъ) 99% 的 置信 有限 . 

习题 11.41 PER 25 个 电灯 泡 ,其 寿命 标准 差 仍 为 120 小 时 , 结果 会 如 何 ? 

对 自由 度 у = 150, (а) 0.05, (b) 2 95. 

对 自由 度 y= 250, 3R (a) Хд.025› (Ь) xg 975. 


证 明 : 当 ， 值 很 大 时 , ү? р 可 以 近似 为 y+ zpV 2v, 其 中 z, 是 标准 正 态 分 布 的 下 p 分 位 数 . 

#7 100 个 电灯 泡 寿 命 标准 差 为 120 小 时 , 用 xX” 分布 求 习题 11.41, 并 将 该 结论 与 用 第 九 章 中 方法 所 
得 结论 相 比 较 . 

习题 11.44 中 具有 最 小 宽度 的 95% 和 置信 区 间 是 什么 ? 

一 公司 生产 的 某 电 缆 的 抗 断 强度 的 标准 差 为 240 ЕЁ, 现 对 这 些 电缆 的 生产 程序 做 一 些 变动 , 测 得 8 个 
电缆 样品 的 抗 断 强度 为 300 磅 , 在 显著 性 水 平 (a) 0.05, (b) 0.01 下 分 别 检验 假设 :变动 后 标准 差 有 
明显 增加 . 


11.49 ”一 城市 在 过 去 100 年 中 年 温度 的 标准 差 为 16 ERE, 现 就 最 近 15 年 中 取 每 月 第 15 天 的 温度 得 平均 
温度 ,并 求 得 其 年 温度 标准 差 为 10 华氏 度 . 在 显著 性 水 平 (a) 0.05, (b) 0.01 下 检验 假设 :该 城市 现 


在 温度 比 过 去 变化 要 小 些 . 

F 分 布 

11.50 对 以 下 每 种 情形 求 下 值 ， 
(a)vl=8,v=10, 求 Бо о; (с)М,=16,М›=25,5Ж Ек о»; 
(Ь)»,=24,»›=11,Ж Foo; (d)Ni=21,N=23, 求 Fo o. 


11.51 XÍ v; =22, v2=27, 3 Fo os. 

11.52 从 两 个 服从 正 态 分 布 具有 方差 40 和 60 的 总 体 中 分 别 抽 取样 本 容量 为 10 和 15 的 样本 , 若 样 本 方差 
为 90 和 50, 试 确定 在 显著 性 水 平 (a) 0.05,(b) 0.01 下 ,样本 1 方差 是 否 比 样本 2 方差 明显 偏 大 ? 

11.53 ”两 个 灯泡 公司 A MB, 其 灯泡 寿命 都 近似 服从 正 态 分 布 , 且 标 准 差分 别 为 20 小 时 和 27 小 时 , ЖА А 
公司 选 16 个 灯泡 , В 公司 选 20 个 灯泡 , 测 得 其 标准 差分 别 为 15 小 时 和 40 小 时 ， 则 在 显著 性 水 平 (a) 
0.05, (b) 0.01 下 ,是 否 可 得 结论 .公司 A 的 灯泡 变异 性 比 公 司 B 的 要 小 ? 


第 十 二 章 y ж 验 


观察 频数 和 理论 频数 


正如 我 们 所 知 ,从 样本 中 所 得 结论 往往 与 期 望 中 的 理论 结论 是 不 相符 的 .例如 ,我 们 把 一 
枚 均匀 硬币 抛 100 次 ,理论 上 讲 应 该 出 现 正面 50 次 ,反面 50 次 ,但 丽 实 上 这 种 结论 是 很 少 出 
现 的 . 

假如 在 一 特殊 样本 中 ,一 事件 集合 Ep En Ез, Е,( Л Ж 12.1) 通 过 观察 知 其 发 生 频 
数 分 别 为 o1，o2，o0;3,…，oi, 称 之 为 观察 频数 ,而 根据 概率 规律 , 它们 期 望 发 生 的 频数 应 该 分 
别 是 e1]，e2，e;3,…，ei, 称 之 为 理论 频数 或 期 望 频 数 .通常 , 我 们 希望 知道 这 些 观 察 频数 是 否 
显著 不 同 于 它们 的 理论 频数 







观察 频数 
理论 频数 


% 的 定义 
存在 于 观察 频数 与 理论 频数 之 间 的 差异 由 统计 其 уг 来 度量 , 其 中 x? 由 下 式 给 出 : 


2 2 2 k 2 
оу = е!) о» — еэ) оь — е) (о: = е 
баа? (өте)? баа)? h (96) 


el e? ер j=l е, а) 
79. АС) М, 则 
Уо = >уе,= М (2) 
男 一 等 价 于 (1) 式 的 表达 式 为 (见习 题 12.11) 
үг = У) 2 – № (3) 


若 ү? = 0, 则 观察 频数 和 理论 频数 完全 相同 ; 若 y? 0, 则 它们 不 相同 , 且 随 着 x? 值 的 增 
大 ,两 者 之 间 的 差距 也 越 大 . 
当 理论 频数 大 于 或 等 于 $ 时 , x? 的 抽样 分 布 非常 近似 干 第 十 一 章 中 曾 提 过 的 用 


2 


Y = Yog De 2 = Yoy ?ez (4) 
来 表示 的 ,2 分 布 , 且 当 理论 频数 信 越 大 时 ,近似 程度 越 好 
自由 度 y 分 下 列 两 种 情况 给 出 : 
(Dv = 一 1 当 总 体 参数 无 需 用 样本 统计 量 来 估计 , 而 可 直接 计算 理论 频数 时 ; 
(2)»=^—1— m, 当 理 论 频数 中 有 т 个 总 体 参 数 要 用 样本 统计 量 来 估计 方 可 计算 时 . 


显著 性 检验 


在 实际 中 , 理论 频数 是 基于 假设 Ho 而 进行 计算 的 . 如果 在 假设 下 , 由 (1) 或 (3) 式 计算 出 
的 x 值 比 某 些 临界 值 要 大 (假如 分 别 代表 在 显著 性 水 平 为 0.05 和 0.01 时 的 临界 值 x3 os 和 
Х0.99), 我 们 将 得 出 结论 :观察 频数 显著 不 同 于 理论 频数 , 从 而 在 相应 显著 水 平 下 拒绝 假设 H, 
否则 ,我们 将 接受 它 (或 至 少 不 拒绝 它 ). 这 个 过 程 ,我们 称 之 为 假设 或 显著 性 的 x 检验 . 

当 x 的 值 非常 接近 0 时 ,我 们 必须 特别 注意 , 因为 观察 频数 与 理论 频数 值 一 致 这 种 情况 


毕竟 是 很 少 的 .为 了 估计 这 种 情形 ,我 们 首先 确定 уг 的 值 是 否 小 于 xi.0s( 或 是 удо), 由 此 决 
定 两 频数 在 显著 性 水 平 0.05( 或 0.01) 下 的 一 致 性 是 徊 太 好 ， 


拟 合 优 度 的 x’ 检验 


六 检验 能 够 被 用 来 确定 经 典 分 布 (如 正 态 分 布 和 二 项 分 布 ) 是 如 何 很 好 地 拟 合 经 验 分 布 
( 即 从 样本 数据 中 所 得 的 分 布 )( 见 习题 12.12,12.13). 


列 联 表 


表 12.1 中 ,观察 频数 占用 了 一 单行 ,被 称 之 为 单 向 分 类 表 . 因为 列 数 为 k, 故 也 称 之 为 1 x 
k R 类似 可 得 双向 分 类 表 , 或 h хь 表 ,在 此 表 中 ,观察 频数 占用 了 л 行 & 列 , 这 样 的 表 通 常 
称 之 为 列 联 表 . 

相应 于 hxk 列 联 表 中 的 每 个 观察 频数 ,都 有 一 个 根据 概率 规律 在 某 一 假设 条 件 下 计算 
得 的 理论 频数 与 之 对 应 .这 些 频 数 ,占用 了 列 联 表 中 的 所 有 单元 , 因此 也 称 之 为 单元 频数 .每 一 
行 或 每 一 列 中 的 总 频数 称 为 边缘 频数 . 

为 讨论 观察 频数 与 理论 频数 的 一 致 性 , 我 们 计算 统计 量 


(о, = е,)? 
“= (5) 


X 

其 中 和 式 包 括 了 列 联 表 中 的 所 有 单元 .记号 o。 和。 分 别 代表 了 第 ; 单元 的 观察 频数 和 理论 频 
数 .这 和 式 类 似 于 (1) 式 ,包括 hk 项 .所 有 观察 频数 之 和 ( 记 为 N) 等 于 所 有 理论 频数 之 和 (与 
(2) 式 比较 ). 

同 前 , 者 理论 频数 不 太 小 , 则 ($) 式 统计 量 的 抽样 分 布 非常 近似 于 由 (4) 式 所 给 出 的 X 分 
布 .这 个 六 分 布 的 自由 度 у 分 下 面 两 情况 给 出 , Н А>1‚ k>1: 

1.y= (hh 一 1)(k 1), 若 理论 频数 无 需 通 过 样本 统计 量 来 估计 总 体 参 数 ,而 可 直接 计算 得 
出 (见习 题 12.18). 

2.v= (hh 一 1)(k 一 1) 一 m, 耕 理论 频数 只 有 通过 样本 统计 量 估计 出 m 个 总 体 参数 后 , Эу 
可 计算 得 出 . 

hxk 表 的 显著 性 检验 相似 于 1 x 表 的 显著 性 检验 .理论 频数 在 一 特定 假设 Ho 下 能 求 
得 .通常 的 假设 是 两 个 类 别 间 相互 独立 . 

列 联 表 可 推广 到 更 多 维 数 的 情形 .例如 ,我 们 能 有 xkx1 表 , 它 代表 了 三 个 类 别 . 


关于 连续 性 的 Yates 修正 


当 连 续 型 分 布 的 结果 要 应 用 于 离散 型 分 布 时 , 正如 我 们 在 前 面 章节 中 所 看 到 的 , 必须 对 连 

续 性 做 某 些 修正 . 当 要 用 到 x? 分 布 时 , 也 有 类 似 的 修正 .(1) 式 中 的 ү? 修正 为 
一 一 2 — — — — 
УЕ) = (l o; а! 0.5 Uo 2. 0.5), Оо е1 0.5) (6) 
Ek 

这 种 修正 通常 被 称 为 Yates 修正 . 对 (5) 式 中 x? 也 有 类 似 的 修正 . 

一 般 情 况 下 ,只 有 自由 度 v=1 时 才 做 修正 .对 大 样本 情形 ,修正 或 非 修正 的 XxX” 所 得 结论 
征 一样 的 , 当然 在 临界 值 处 会 有 点 麻烦 (见习 题 12.8). 对 于 理论 频数 值 在 5 到 10 之 间 的 小 样 
本 事件 而 言 ,最 好 是 能 比较 一 下 修正 前 和 修正 后 的 x? 所 得 的 结论 .如 果 对 某 一 假设 ， 所 得 结 
论 一 致 , 例如 在 0.05 显著 性 水 平 下 拒绝 假设 , 则 不 会 遇 到 什么 麻烦 . 如 果 他 们 所 得 结论 不 同 ， 
则 可 以 求助 于 增 大 样本 容量 , 若 这 种 方法 不 适用 , 则 可 运用 概率 的 方法 来 解决 包括 第 六 章 中 
的 多 项 分 布 . 


计算 x? 的 简单 公式 
当 不 需要 估计 总 体 参数 , 由 样本 频数 可 直接 计算 理论 频数 时 ,有 一 个 计算 y? 的 简单 公 


式 .下面 给 出 了 2x2 和 2x3 列 联 表 的 结果 . 


2х2 表 . 
) N(aib;, = а61)? мд (7) 
X 一 (а1 + 21) (аз + Б) (ај + a2)(b1 + b2) МММ.“ 











其 中 
A=aib2 a201, N=aı tat bit 6, Мъ№М= ау + bis № =a: + Б, Na = а; + az, Np= 6 + Б. 
(见习 题 12 .19 ) 

用 Yates 修正 , (7) 式 变 为 








2 
, М | aiba = a2b1 I= УМ] Nai- EN) 
X (修正 ，) К (a, + bila» + Ь,)(а} + аз) (Бү + ba) ~ Ni N: МАМА (8) 
2х3. 
‚_ М[аү аҙ s у 5% 25 | 
X - а.а ТММ N м, N (9) 
其 中 我 们 使 用 了 对 所 有 列 联 表 都 有 效 的 一 般 结论 ( 见 习题 12 .43) ， 
2 
у = У! z -N (10) 
结论 (9) 能 推广 到 所 有 的 2x& R, 其 中 >3( 见 习题 12.46). 
列 联系 数 


列 联 表 中 各 类 别 间 的 独立 性 或 相关 程度 的 度量 由 下 式 给 出 ; 


2 
C = z (11) 
X 


С 被 称 之 为 列 联系 数 . С 值 越 大 , 表明 相关 程度 也 越 大 、 列 联 表 中 的 行 数 和 列 数 决定 了 C 的 最 
大 值 ,此 值 小 于 或 等 于 1. 如 果 列 联 表 中 的 行 数 和 列 数 均等 于 k, W C 的 最 大 值 为 VV (k 一 1)/& 
(见习 题 12.22, 12.52, 12.53). 


属性 相关 


因为 列 联 表 中 各 类 别 通常 描绘 了 个 体 或 事物 的 特性 ， 我 们 通常 称 之 为 属性 , 其 独立 或 相关 
联 的 程度 则 称 之 为 属性 相关 .对 xk 表 , 我 们 定义 


2 
S S а 
NGD (12) 


作为 属性 间 ( 各 类 别 间 ) 的 相关 系数 , 其 中 0 之 ;之 1( 见 习题 12.24). 对 2x2 表 , 其 相关 性 通常 
称 之 为 四 项 相关 . 
数值 变量 的 一 般 相 关 问题 在 第 十 四 章 中 给 予 讨论 ， 


xX” 的 可 加 性 
假设 重复 试验 所 产生 的 y? 样本 值 分 别 为 у2, y2 y2 ВАКЫ... 


那么 所 有 这 些 试 验 的 结果 可 以 看 成 一 个 试验 结果 , 其 yx? 值 为 x? + x+ x+…， 其 自由 度 为 
vi Hva + уз 十 …( 见 习题 12.25). 


习题 及 解答 


X 检验 


12.1 


12.3 


12.4 


把 一 硬币 抛 200 次 ,得 115 次 正面 和 85 次 反面 .在 显著 性 水 平 (a) 0.05, (Ь) 0.01 下 检 
验 假设 :硬币 是 均匀 的 . 

E F 正面 与 反面 的 观测 频数 分 别 为 o =115 和 о, = 85， 而 理论 频数 ( 若 硬币 是 均匀 的 )e; = 100 
和 ез = 100. 因 此 


› _ (0161), (oz-ea)2 _ 115—100 - (85 = 109 - -4.50 


х €i ё2 
НУЛЕ = 2,0=6-1=2-1= 1. 
(а) 目 由 度 为 1 的 临界 值 Xi. ss = 3.84, HX 4.5023.84, 故我 们 在 显著 性 水 平 0.05 下 拒绝 硬币 是 均 
习 的 这 个 假设 
(b) 自由 度 为 1 的 临界 值 Xo %= 6.63, 因为 4.30<6.63, 故 我 们 在 显著 性 水 平 0.01 下 接受 硬币 是 均 
匀 的 这 个 假设 ， 
我 们 得 到 结论 :观察 结果 是 可 能 显著 的 , 即 硬币 可 能 不 均匀 . 
用 Yates 修正 求 习题 12 .1 


解 EF 
(10; = ер 1 0.5)? (| o2 = е5 1 ~ 0.5)? 
2 一 一- ~- ”~ Кр 一 -一 一 一- ~ 
x (修正 ) = е + е; 


- 115-1001 0.5) (185 – 1001 0.5)? 


100 100 
_14.52 14.52 _ 
= 100 + 100 = 4.205 


[8 4 4. 205 23.84 Н 4.205< 6.63, Wt 12.1 所 得 结论 是 有 效 的 . 
通过 用 正 态 分 布 近似 二 项 分 布 来 求 习 题 12.1. 
Е S 假设 硬币 是 均匀 的 , 则 硬币 抛 200 次 出 现 正 面 次 数 的 均值 和 标准 差 应 分 别 为 y = Np = 200 
х0.5=100,с= V Npg = V200x0.5x0.5=7.07 
解法 一 
115 次 正面 的 标准 值 = 112—100. 2.12 


用 双边 检验 , 在 显著 性 水 平 0.05 下 , 若 z 值 在 区 间 ( -1.96,1.96) 之 外 ， 我 们 将 拒绝 假设 ;硬币 是 
均匀 的 .在 显著 性 水 平 0.01 下 ,相应 区 间 为 ( -2.58,2.58). 故 (如 习题 12.1 所 得 ) 可 得 :在 0.05 水 平 
下 ,我 们 拒绝 假设 ,但 在 0.01 水 平 下 ,接受 假设 . 

注意 ,上面 标 准 值 的 平方 即 , 2.122 = 4. 50 等 于 习题 12.1 中 所 得 的 六 值 .这 是 分 类 数 &=2 的 y? 
检验 中 必 有 的 结论 (见习 题 12.10). 
解法 二 ”用 连续 修正 , 115 或 更 多 次 正面 等 于 114.5 或 更 多 次 正面 . 则 114.5 次 正面 的 标准 值 = 
(114.5 一 100)/7.07=2.05. 这 样 所 得 结论 与 第 一 种 方法 相同 . 

注意 , 这 标准 值 的 平方 即 2.05? = 4.20 与 习题 12.2 中 用 Yates 修正 所 得 x 的 修正 值 一致 , 这 是 
用 Yates 修正 分 类 数 上 = 2 的 у? 检验 中 必 有 的 结论 . 

K 12.4 给 出 了 一 般 子 抛 拂 120 次 所 得 的 观测 频数 与 理论 频数 . 在 显著 性 水 平 0.05 下 
检验 假设 : 骨 子 是 均匀 的 . 


表 12.4 


эти т, [э [+ [з 
ш [э [эт [вэ [м 
menu | Га |a а Га 
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Ж EF 
2 2 2 2 2 _ 2 
一 一 一 一 — её о е 
p ea (0554) ‚ (03— ea) (оа e)? (оз е5)2 (os 一 ee 
<1 £2 ёз е4 €5 E6 


_ (25 — 20)? 07-20% , (15 – 20)? „ (23—20)? ‚ 4-20% (16- 20)? 
© 2 20 20 20 20 20 


=5.00 
因为 分 类 数 上 =6,y= -1I=5. 对 自由 度 为 5 的 临界 值 x? os = 11.1. 因 为 5.00<11.1, 故 不 能 拒绝 假 
R RTE. 
对 自由 度 5, Xios=1.1S<5.00. 因 此 这 个 一 致 性 还 没有 好 到 足以 产生 怀疑 的 程度 . 
12.5 表 12.5 给 出 了 某 随 机 数 表 中 的 250 个 数 中 数 0，1,…, 9 的 分 布 情况 , 问 观察 频数 是 否 
明显 不 同 于 理论 频数 ? 








si TaTT Tree 
СЛЕЗЕ ТЕЕ 
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解 ESF 
2 _ (17—25)? ‚ (31- 25)2 ‚ (29 - 25)? ‚ U8- 25): 
А225 25 25 25 
+ 十 86257 = 23.3 
对 v= 一 1=9, 临 界 值 x = 21.7< 23.3, 因此 , 在 显著 性 水 平 0.01 Т. 观察 频数 明显 不 同 于 理论 
频数 . 


12.6 在 Gregor Mendel 的 更 豆 实验 中 , 他 观察 到 有 315 粒 圆 黄 的 , 108 粒 圆 绿 的 , 101 粒 皱 黄 
的 ,32 粒 皱 绿 的 .根据 他 的 理论 , 这 些 种 类 的 数量 比 应 是 9: 3:3: 1, 问 在 显著 性 水 平 (a) 
0.01, (b) 0.05 下 ,有 无 根据 对 此 理论 表示 怀疑 ? 
М F 跪 豆 的 总 数量 是 315 + 108 + 101+ 32 = 556. 按 比例 9:3:3:1, 我 们 期 望 得 到 . 


Z x 556 = 312.75 К; т х 556 = 104.25 粒 皱 黄 的 ; 
5. x 556 = 104.25 粒 圆 绿 的 ;站 x 556 = 34.75 RAR; 


2 _ (315 - 312.75)? (108 – 104.25)? (101 - 104.25)2 (32 - 34.75)? 
y = 5 + + 25 + 


312.7 104.25 104. 34.75 
=0.470 

ОУК А = 4, у= 6-1-3. 

(а) 1 0=3, убу = 11.3. НЕ 0.01 显著 性 水 平 下 不 能 拒绝 理论 

(b) 对 v=3, 50.05 = 7.81. КЖЕ 0.05 显著 性 水 平 下 不 能 拒绝 理论 

得 结论 :理论 和 实验 是 一 致 的 . 

注意 ,对 v=3,Xios=0.352<0.470. 因 此 ， 尽管 得 到 好 的 一 致 性 ,但 得 到 的 结果 还 是 在 合理 的 抽 

样 误差 之 下 ， 

12.7 一 饶 子 里 装 有 大 量 4 种 不 同 颜色 的 弹子 : 红 的 、 桔 黄 的 、 黄 的 、 绿 的 . 现 随机 从 里 面 抓 出 


12 粒 弹 子 , 其 中 有 2 粒 红 的 ,5 粒 桔 黄 的 ,4 粒 黄 的 ,1 ЖУБАН. Б: ET E S A AHE 
同比 例 的 不 同 颜色 弹子 . 


М кє 解法 一 假设 罐子 里 各 种 弹子 所 占 比 例 相 同 , 则 取出 12 粒 弹子 ,各 种 颜色 的 应 各 占 3 粒 . 因 


为 理论 频数 比 5 小 , 则 用 y? 近似 不 太 活 合 .为 避免 这 种 情况 ,我 们 采用 组 合 分 类 使 理论 频数 至 少 为 5. 
如 果 我 们 拒绝 假设 , 则 应 采 。” ”最 好 的 拒绝 假设 的 组 合 分 类 方法 . 这 里 , 我 们 把 “ 红 的 或 绿 的 ” 
分 为 一 类 ,“ 桔 黄 的 或 黄 的 "分 ”类 . 则 其 相应 样本 值 为 3 或 9, 而 理论 频数 均 为 6. 则 有 


(3-6) (9-6)? _ 
Xy = 6 + 6 =3 


X] v=2-1=1, 0.95 = 3.84.1410, RIE REKE 0.05 下 ,不 能 拒绝 假设 (尽管 在 0.01 KEF, 
我 们 将 拒绝 假设 ). 可 以 想象 ,即便 各 颜色 弹子 具有 相同 比例 ,但 观测 结果 还 得 依赖 偶然 性 
解法 二 H Yates BE, 我 们 有 

POBE) = U36 os}, (1 9- РЕ _ 2.5° 2.5° 





所 得 结论 与 上 面 一 致 因为 уме BEREND x? 8, 收 上 这 的 结论 是 当然 的 
应 该 注意 , 尽管 理论 频数 很 小 , 我 们 仍 用 у? 近似 , 将 得 
_ (2-3)* (5-3)? (4-3)2 0-3} 
7 3 + 3 + 3 + 3 = 3.33 


对 "=3，Xt.ss=7.81. 从 而 得 与 上 相同 结论 .但 是 事实 上 , 对 小 频数 而 言 , xy? 近似 是 不 合理 的 , 若 组 合 
频数 不 可 取 的 话 , 我 们 必须 采用 第 六 章 中 精确 的 概率 方法 . 

12.8 把 一 对 仍 子 抛掷 360 次 ,得 74 次 7,24 次 11, 在 0.05 显著 性 水 平 下 检验 假设 ;这 对 锅子 
是 均匀 的 . 


解 кє СЯ 36 种 结果 ,其 中 得 7 值 的 有 6 种 ,得 11 值 的 有 2 种 . 故 P(7)= 蕊 =,P 


1 
6 
an-ż-4 To. AEE 360 次 抛掷 中 ， 我 们 期 望 有 -< x 360 = 60 次 7 值 和 x 360 = 20 次 11 值 . 则 
2 _ (74-60)7 (24-20)? _ 
y = 60 + 20 = 4.07 
对 v=2-1=1， Xi.s5=3.84<4.07, 故 拒绝 假设 ; 避 子 是 均匀 的 .然而 用 Yates 修正 ,有 
_ — 2 _ _ 2 2 2 
y2( 修 正 ) = (174 60. 0.5), (124 21. 0.5)? 13.5 3.5? 


СО z0 = 3-65 
因此 ,基于 y 修正 值 , 在 0.05 显著 性 水 平 下 ,我 们 不 能 拒绝 假设 . 

一 般 来 讲 ,对 这 里 所 碰 到 的 大 样本 事件 ,用 Yates 修正 所 得 结论 更 合理 一 些 但 х 修正 值 与 临界 
值 如 此 相近 ,我们 不 得 不 犹 隐 到 底 取 哪 一 个 结论 .在 这 种 情况 下 ， 如 采 我 们 一 定 要 在 0.05 显著 性 水 平 
下 作 检 验 , 那么 最 好 的 办 法 是 增加 样本 观测 值 的 个 数 . 否则, 如 果 我 们 愿意 的 ， 可 在 其 他 水 平 (例如 o. 
10 水 平 ) 下 ,拒绝 该 假设 . 

12.9 对 有 5 个 孩子 的 320 户 家 庭 做 统计 如 表 12.6 所 示 . 试 问 所 得 结果 与 假设 :“ 男 孩 . 女 孩 
的 出 生 比 率 一 样 ” 一 致 吗 ? 


表 12.6 


5 男 |4 男 |3 男 |2 男 |1 男 |0 男 
i 1 女 |2 女 |3 女 | 4 女 | 5 女 


_18_ Tl wT | ИЕ 320 









解 E 设 p 为 生男 孩 概 率 ,g=1-p 为 生 女 孩 的 概率 . 则 “5 个 男孩 ",“4 男 1 女 ”,…… “5 个 女 
孩 " 的 概率 由 二 项 展 式 可 得 

(p +q) = рУ+5р*ф + 10p°q? + 10624 + Spgq* + q’ 
#р= а= 六 , 则 有 


РО 个 男孩) = 2) = 4, P(2 男 3 女 ) = 02) | 


4 5 ll 
P44 男 1 女 ) =5| 汪 | {g rasm- shit] S 
ч 3 2 1 5 
P(3 男 2 女 ) =10| 2 (4) = 0, Р(5 个 女孩 ) = | 十 | = 3) 
则 用 320 RAA ERBAS 5,4, 3,2, 1,0 个 男孩 的 家 庭 数 分 别 为 10, 50, 100, 100, 50,10. 因 此 
> (18-10) А (56 – 50)? | (110 – 100)? | (88 – 100)? 
- 10 50 100 100 


(40 - 50)? (8-10)? 
+ + 
50 10 
= 12.0 
XÍ у=6-1= 5, 6.95 = 11.1, Xio%=15.1, 因 此 我 们 在 水 平 0.05 下 拒绝 假设 ,但 在 0.01 下 不 能 拒绝 
假设 .因此 得 结论 :男孩 ,女孩 的 出 生 比 率 可 能 不 相等 . 
12.10 对 500 个 人 进行 统计 , 得 上 周 有 155 人 从 一 VCD 租赁 商 处 租用 至 少 一 个 уср. 用 双 


边 检 验 在 水 平 a=0.05 下 检验 假设 :上 周 有 25% 的 人 租用 至 少 一 个 VCD. 用 标准 正 
态 分 布 和 X 分布 进行 检验 ,证 明 涉 及 两 种 分 类 的 y? 检验 等 价 于 第 十 章 中 对 比例 所 
用 的 显著 性 检验 . 





解 E 如 果 零 假设 成 立 , 则 j= Np = 500 x0.25= 125,0= V Npg =9.68. 计 算得 检验 统计 量 > 
= (155 -125)/9.68=3.10. 临 界 值 为 +1.96, 故 零 假设 遭 到 拒绝 . 
用 x* 分 布 所 得 结论 ,可 从 表 12.7 中 得 

2 _ (155~ 125)- (345-375)? _ _ 9g 46 


X 125 375 
ХВАН 1 #0 x6.9s=3.84<9.6, 因 此 拒绝 零 假设 .注意 ,3.10?=9.6,( 鞋 1.96)? =3.84 或 者 说 „2 
=x”, 即 这 两 种 方法 是 等 价 的 . 


2 
12.11 (а) 证 明 本 章 的 公式 (1) 可 写成 x?= У) 22-м. 
(b) 用 (a) 中 所 得 结论 检验 习题 12.6 中 所 得 y? 值 . 
解 SF (а) 由 定义 


= уу (020) (о, — е)? уа 


е, 


2 2 
зй. У 2 -2м+м= У 2 - 











其 中 用 了 本 章 中 的 公式 (2). 
(Ь) 
= 2, N=- 5 + пе + ЕТ + 5 7 596 = 0.470 
拟 合 优 度 
12.12 用 x“ 检验 来 确定 习题 7.31 中 表 7.4 所 示 数 据 的 拟 合 优 度 . 
н Бе 


2 _ (38 - 33.2) (144 – 161.9)? + 0342 - 316.2)? (287 – 308.7)? 
33.2 161.9 316.2 308.7 
— 2 _ 2 
+ 0164 — 150.7)? (25 ~ 29.4) 


150.7 29.4 
=7.54 


12.13 


列 联 表 


12.14 


因 为 在 估计 理论 频数 中 所 用 参数 量 为 mx = 1( 即 二 项 分 布 中 参数 p), 故 v=k-1-m=6-1-~1=4. 
Xf „=4, убу, 一 9.49, 因 此 数据 的 拟 合 是 好 的 . 
对 vy 二 4，x6.0s=0.711. 因 为 x*=7.54>0.711, 故 该 拟 合 又 不 是 很 好 到 难以 相信 的 程度 . 
确定 习题 7.33 PR 7.6 所 示 数 据 的 拟 合 优 度 . 
解 F 
2 _ {5-4.13) _ (18 – 20.68)? (42- 38.92)? (27 一 27.71)2 (8- 7.43)? 
X 5 зз "Т бї 38.92 7 2л + 7B 
= 0.959 
因为 在 估计 理论 频数 中 所 用 参数 量 为 m =2( 即 正 态 分 布 中 的 期 望 „ 和 标准 益 c),v = 有 -1- =5 
-1-2=2, 
对 v =2, yi.95=5.99, 故 说 数据 拟 合 是 好 的 . 
对 y=2，x$.0s 二 0.103<<0.959, 故 说 该 拟 合 又 不 是 “ 太 好 ”. 


用 у> 检验 解 习题 10.20. 
# кє 解法 一 ”问题 中 条 件 由 表 12.8(a) 给 出 .在 零 假设 Hu: “血清 没有 效力 "下 , 我 们 期 望 每 一 


组 中 有 70 人 康复 ,30 人 没有 康复 , 如 表 12.8(b) 所 示 . 注意 ,假设 Н, 即 为 康复 不 依赖 于 血清 的 使 用 
( 即 各 类 别 是 相互 独立 的 ). 


表 12.8(b) 在 五 ,下 的 理论 频数 


В 





2 _ (75-70)?  (65-70} (25 - 30)? (35 – 30)? 
+ o ww 103 


为 确定 自由 度 值 ,考虑 表 12.9, 此 表 与 表 12.8 相同 ,只 是 仅 写 出 其 中 的 总 数值 ， 很 显然 ,我 们 可 
以 在 4 个 空格 中 任 一 个 空格 填 上 一 个 数字 ,但 一 旦 这 个 数字 填 上 了 , 其 他 空格 处 的 信 由 于 总 数 的 确 
定 而 惟一 确定 下 来 了 , 故 说 该 处 自由 度 为 1. 





解法 二 ”由 公式 (见习 题 12.18),v=(h-1)(k-1)= 1. 对 自由 度 为 1, y$ os 一 3.84>>2.38, 因 此 在 


”0.05 水 平 下 ,得 出 结论 无 效 . 即 我 们 在 此 水 平 下 ,不 能 拒绝 Ho. 我 们 也 可 以 得 出 结论 ;在 进一步 检验 


12.15 


之 前 ,血清 是 无 效 的 . 

注意 , x*=2.38 是 = 值 的 平方 , = =1.54 是 在 习题 10.20 中 所 得 结论 .一般 来 讲 ,在 2x2 列 联 
表 中 涉及 样本 比例 的 y? 检验 等 价 于 用 正 态 近 似 的 比例 差异 的 显著 性 检验 . 

同时 注意 , 用 x? 的 单 边 检验 等 价 于 用 у 的 双边 检验 . 例如 ， XY > щт y > yoo B 
X< 一 Xo0.95. 因 为 对 2x2 列 联 表 来 讲 , y? 即 为 z 的 平方 , 故 可 以 说 х 为 z. 因 此 ,在 0.05 水 平 下 ,用 
Х^ 检验 而 拒绝 某 假设 等 价 于 在 水 平 0.10 下 ,用 z 的 双边 检验 拒绝 该 假设 . 
用 Yates 修正 来 讨论 12.14. 


解 EF 


(175 – 70 -0.5) U 65 – 70 一 0.35)- ， (125-30 1-0.5)? 
70 70 30 
__ __ 2 

‚ (135-301—-0.5)? _ ] 93 


30 
因此 说 习题 12.14 中 所 得 结论 是 有 效 的 .事实 上 这 可 由 Yates 修正 总 是 减少 уг 值 而 得 到 . 
一 电话 公司 对 不 同年 龄 拥有 手机 的 情况 进行 了 调查 , 其 中 对 1000 人 调查 所 得 结果 如 
Ж 12.10 所 示 . 检 验 假设 Ho: 不 同年 龄 层 拥 有 手机 的 比例 是 一 样 的 . 


X (EE) = 


12.16 


== 10 





М F ХЕ Ho 假设 成 立 下 ,每 一 年 龄 层 拥 有 手机 的 比例 应 是 250/1000 = 25% . 故 每 一 年 龄 层 不 拥 


有 手机 的 百分比 为 75% .理论 频数 如 表 12.11 所 示 . 


х 统计 量 的 计算 值 由 表 12.12 给 出 . 
X 的 自由 度 为 v=(h 一 1)(k 一 1)==3,， у$5=7.81,Ї 14.3>7.81, 故我 们 拒绝 零 假设 而 得 结论 ;4 


个 年 龄 层 拥 有 手机 比例 是 不 同 的 . 


o >s |ë 


250 #9 25% =62.5 | 250 0 25% =62.5 | 250 #9 25% =62.5 350425% L 62.5 





12.17 用 Minitab 解 习题 12.16. 
解 ”& 下 面 是 由 Minitab 软件 得 到 的 习题 12_16 之 解 .观察 频数 和 理论 频数 显示 在 检验 统计 量 的 


计算 中 .注意 , 当 显著 性 水 平 超过 0.002 时 零 假 设 就 被 拒绝 . 
Data Display 

Row 18-24 25—54 55—64 65 ог more 

1 50 80 70 50 

2 200 170 180 200 


MTB > chisquare cl ~ c4 
Chi-Square Test 


Expected counts are printed below observed counts 


18—24 25- 54 55-64 65 or mo Total 
1 50 80 70 50 250 
62.50 62.50 62.50 62.50 
2 200 170 180 200 750 
187.50 187.50 187.50 187.50 
Тоха] 250 250 250 250 1000 
Chi-Sq= 2.500 + 4.900 + 0.900 + 2.500 + 


0.833 + 1.633 + 0.300 + 0.833 = 14.400 
DF = 3, P-Value = 0. 002 
12.18 证 明 对 hxk 列 联 表 , 其 自由 度 为 (h 一 1)x(k 一 1), 其 中 >1, k>1. 
Ж F Eh 行 上 列 的 表 中 ,我 们 可 以 对 每 行 每 列 中 的 一 个 数 不 予 考虑 , 因为 利用 总 数值 是 可 以 
得 到 这 些 数 的 .也 就 是 说 对 疡 x& 表 中 ,有 (A -1) x(k 一 1) 个 数 可 由 我 们 自由 填写 , 而 剩 下 的 则 自 
动 惟一 确定 下 来 了 .因此 说 该 表 的 自由 度 为 ( -1)x(k-1). 
注意 ,在 理论 频数 中 所 需 的 总 体 参 数 是 已 知 的 情况 下 , 该 结论 是 成 立 的 ， 
12.19 (а) 证 明 在 表 12.13(a) 中 所 示 的 2x2 列 联 表 中 
2 _ N(aib; – azb Y 
NIN, NAaNs 


(b) 参照 习题 12.14 中 数据 来 前 明 (a) 的 结论 . 


表 12.13(b) 理论 结果 


1 r а 
NINa/N NNa/N 


解 E 如 习题 12.14 所 示 , 在 零 假设 下 所 期 望 的 结果 由 表 12. 13(b) 给 出 , 则 


2 ~ (al NINA/N)Y (аз – NaNa/N)? 
х М МАМ NNa/N 
(61— №М№њ/м)? ‚ (62 = Na Ng/N)? 
№, Ng/ N N: Ng/ N 














但 
а - NiNa = a- (а, + bi)(ail+t az) _ aib — азб 
N а + bi + az + b3 N 
同样 地 
ММА р ММ. NaNB ауаз, 
у бту FH- NN = ——е—- 
因此 我 们 能 写成 
x? — N | 02-0201) *, № aba- aahi) 
№, Na N №МА М 
N | 422 сар) + М EL — 2011 
N, Ng N N- Np N 
可 化 简 成 


ү? = М(а\ё&; – аз)? 
М,М»МАМ» 


(b) 在 习题 12.14 +, а, = 75, а›=25, б|=65, б,=35, № = 140, Na=60, Na=100, № = 100, 
N=200, 则 由 (a) 所 得 ,有 
2 _ 200 x (75 x 35- 25 х 65)? _ 338 








X © 140 х60 х 100 х 100 
用 Yates 修正 , 其 结果 与 习题 12.15 中 结论 相同 : 
2 
М Габ — аб) +y] 
2 ЁТЕ — - 
x 《修正 ) N N3 NAN; 


_ 200 x (175 х 35 – 25 х 65 |- 100)? 


140 x 60 x 100 x 100 = 1.93 


12.20 对 900 位 男人 和 900 位 女人 调查 以 便 确 定 他 们 是 否 希望 更 多 的 联邦 机 构 来 帮助 照顾 
小 孩 ,其 中 有 40% 女 人 和 36% 男人 对 此 表示 同意 .检验 零 假 设 : 表 示 同 意 的 比例 相同 ， 
对 应 的 备 择 假设 为 :表示 同意 的 比例 不 同 . 并 说 明 涉 及 两 样本 的 比例 的 у^ 检验 等 价 
于 第 十 章 中 用 正 态 近似 的 比例 差异 的 显著 性 检验 . 
B S 在 假设 Ho F 
FP -P, =0 
sp p, = pal N + A — [0.38 x 0.62 х бс + | = 0.0229 
其 中 p 由 两 个 样本 的 联合 比例 来 估计 , 即 
= т = 0.38， g=1-p= 0.62 
正 态 近 似 检 验 统计 量 为 
Pı- Рә 0.40-0.36 | 
2 = ap -p, 0.0229 ` 1.7467 
由 Minitab 软件 给 出 的 х 分 析 的 解 如 下 ， 
Chi.Square Test 
Expected counts are printed below observed counts 
males females Total 
1 324 360 684 
342.00 342.00 
2 576 549 1116 
558.00 558.00 
Total 900 900 1800 
Chi-Sq= 0.947 + 0.947+ 
0.581 + 0.581 = 3.056 
DF=1, P- Value = 0.080 
ESAERA RAH Р 77 Ж 1.7467 = 3.056, 正如 等 于 x? 统计 量 的 值 .因此 ,两 种 检验 是 等 价 
的 ,它们 的 户 - 值 总 是 相同 的 . 
列 联系 数 
12.21 对 习题 12.14 中 列 联 表 所 示 数 据 , 求 其 列 联 系数 . 
解 = 
- 1-6 гу 5 ЖЕТШЕ, А = v0.01176 = 0.1084 
12.22 对 习题 12.14 中 列 联 表 求 C 的 最 大 值 . 


解 ES 当 两 种 类 别 完全 相依 时 , С 取 最 大 值 .此 时 ,所 有 用 了 血清 的 人 都 会 康复 ,没有 用 血清 的 都 
不 会 康复 得 很 好 . 则 列 联 表 将 如 表 12.14 R. 





在 假设 完全 独立 情况 下 ,每 个 单元 的 理论 频数 均 为 50, 故 
y? = (00— 50)- , (0 - 50) , (0 - 50)- , (100-50) _ 200 
50 50 50 50 


因此 C 最 大 值 为 : у /(у + №) = 0.7071. 
一 般 地 ,对 行 与 列 数 均 为 & 的 列 联 表 中 完全 相依 情形 , 非 零 的 单元 频数 会 在 从 上 左 到 下 右 的 对 
角 线 上 .此 时 , Со, = У (k -1)/k.( 338 12.52 和 12.53) 


属性 相关 


12.23 对 习题 12.14 中 表 12.8, (а) 不 用 , (b) 用 Yates 修正 来 求 相关 系数 ， 
解 EF (а) 因为 六 =2.38，N=200, &=2, 则 有 


2 
/| x 2.38 
r N(k - 1) 200 


表明 用 血清 与 康复 之 间 存 在 很 小 的 联系 . 
(b) 从 习题 12.15, 得 
r( 修 正 ) = V1.93/200 = 0.0982 
12.24 证 明 列 联 表 的 相关 系数 值 处 于 0 与 1 之 间 , 如 本 章 (12) 式 所 示 . 


解 F 由 习题 12.53 知 , V X2/(X2+ N) 的 最 大 值 为 V(E 1) 人 ,因此 
Ee 2 和 (DO2+N ы ука м 


ЫП 


2 2 
ERDN 0—1 r= | 
N(k— 1) N(k—1) 


而 у?2>0, ›;®0,ЩЖ 01. 
x? 的 可 加 性 


12.25 为 检验 假设 Ho 一 实验 进行 了 3 次 .所 得 y? 值 分 别 为 2.37,2.86 和 3.54. 每 次 的 自 
由 度 均 为 1 .证明 , 基于 任 一 单个 实验 ,在 0.05 显著 性 水 平 下 ,不 能 拒绝 假设 Ho 而 把 
三 个 实验 综合 起 来 , 则 将 拒绝 Ho. 
EO F 综合 3 次 实验 所 得 结果 , 根据 可 加 性 质 , 得 x? 的 值 为 x? =2.37+2.86+3.54=8.77, 自 


由 度 为 1+1+1=3. 对 v=3,Xio=7.81<8.77, 故 拒绝 Ho. 而 对 v=1 ‚76.55 = 3.84, 因此 基于 一 
次 实验 我 们 不 能 拒绝 有 H,. 在 综合 实验 中 , Yates 修正 被 略 去 , 因为 它 有 一 个 过 分 正确 的 趋势 . 


АМЕ У 
х 检验 


12.26 ”一 候 币 抛 搓 60 次 得 37 次 正面 23 次 反面 .在 显著 性 水 平 (a) 0.05, (Ь) 0.01 下 检验 假设 ;硬币 是 均匀 
的 . 

12.27 用 Yates 修正 讨论 习题 12.26. 

12.28 长 期 以 来 ,一 批 教 员 对 某 一 特殊 课程 所 给 出 的 成 绩 平 均 都 是 12% 的 A,18% 的 B,40% 的 C,18% 的 
О 和 12% 的 下. 现 有 一 新 的 教员 两 个 学 期 以 来 对 这 门 课程 给 出 了 22 个 A,34 个 B,66 个 C,16 个 D 


和 12 个 下 . 试 在 显著 性 水 平 0.05 下 ,确定 新 教员 的 评分 形式 是 否 与 其 他 人 人 一样 . 
12.29 同时 抛掷 3 枚 硬币 240 次 ,其 每 次 正面 出 现 的 次 数 统计 如 表 12.15 所 示 , 同时 表 中 也 给 出 了 在 假设 硬 
币 是 均匀 情况 下 的 期 望 结果 , 试 在 显著 性 水 平 0.0$ 下 检验 该 假设 . 


表 12.15 


观察 频数 108 95 23 
理论 频数 | м | 9% | 9% | 30 


12.30 在 某 一 特定 周 , 从 一 公立 图 书馆 所 借 书 的 数量 如 表 12.16 所 示 , 试 在 显著 性 水 平 (a) 0.05, (Ь) 0.01 
下 检验 假设 :所 借 书 的 数量 与 这 星期 中 哪 一 天 无 关 . 


# 12.16 


TE EWE 
ЕК | з; мв 


12.31 ETEA 6 个 红 球 和 3 个 白 球 .从 里 面 任 取 两 个 , 记 下 它们 的 颜色 , RERET, 如 此 反复 取 120 
次 ,所 得 结果 如 表 12.17 Бі. 
(а) 确定 理论 频数 . 
(b) 在 显著 性 水 平 0.05 下 ,确定 观察 结果 与 期 望 结果 是 否 一 致 . 


表 12.17 








12.32 从 4 台 机 器 所 生产 的 产品 中 各 任 取 200 个 螺栓 , 发 现 它们 的 次 品 数 分 别 为 2,9,10 和 3. 试 在 显著 性 水 
平 0.05 下 ,确定 这 些 机 器 是 否 有 明显 差异 . 


拟 合 优 度 


12.33 (а) 用 x” 检验 来 确定 习题 7.75 中 表 7.9 的 数据 的 拟 合 优 度 . 
(b) 在 0.05 显著 性 水 平 下 讨论 该 拟 鱼 是 否 很 好 ? 

12.34 № y 检验 确定 (a) 习题 3.59 中 表 3.8，(b) 习题 3.61 中 表 3.10 的 数据 的 拟 合 优 度 . 并 在 显著 性 水 
平 0.05 下 讨论 这 些 拟 合 是 否 很 好 ? 

12.35 用 x 检验 确定 (a) 习题 7.79 中 表 7.9，(b) 习题 7.80 中 表 7.10 的 数据 的 拟 合 优 度 . 问 (a) 中 所 得 的 
结果 与 习题 12.23 的 结论 一 致 吗 ? 


列 联 表 


12.36 表 12.18 给 出 了 某 实 验 室 接种 某 种 疫苗 的 效力 的 一 次 实验 结果 , 该 实验 室 专用 于 研究 动物 的 抗 癌症 
试 在 显著 性 水 平 (a) 0.01, (b) 0.05 下 检验 假设 .接种 与 不 接种 之 间 没 有 什么 差异 ( 即 接 种 疫苗 与 抗 


WRAK). 
Ж 12.18 Ж 12.19 
未 患 病 未 通过 
接种 疫苗 
未 接种 疫苗 


12.37 用 Yates 修正 讨论 习题 12.36. 


12.38 


12.39 


12.40 


12.41 


12.42 


12.43 


12.44 


12.45 
12.46 
12.47 
12.48 


Ф 12.19 给 出 了 A 班 与 B 班 各 通过 某 一 考试 的 情况 . 试 在 显著 性 水 平 (a)0.05, (b) 0.01 下 检验 假 
设 :两 个 班 没 多 大 益 异 .分 别 用 和 不 用 Yates 修正 来 检验 该 假设 . 
有 一 群 病人 埋 忽 他 们 睡眠 不 好 ,于 是 让 一 些 人 服用 安眠 药 , 另 一 些 人 服用 糖衣 药片 (他 们 都 认为 自己 
服 的 是 安眠 药 ). 表 12.20 给 出 了 事后 他 们 的 不 同 反 应 情况 ,假设 所 有 病人 所 言 属实 , 则 在 显著 性 水 平 
0.05 下 检验 假设 :安眠药 与 糖衣 药片 之 间 没 有 区 别 . 
表 12.20 
| 睡眠 好 | 睡眠 不 好 


服 安眠 药 10 
服 糖 衣 药 35 


在 一 次 全 国 性 的 重大 决策 上 , 民主 派 与 共和 派 人 士 表 决 如 表 12.21 所 示 . 试 在 显著 性 水 平 (a) 0.01, 
(b) 0.05 下 检验 假设 :在 有 关 这 次 决策 问题 上 ,两 党 派 没有 多 大 差异 . 


R 12.22 给 出 了 学 生 的 物理 成 绩 和 数学 成 绩 情况 . 试 在 (a) 0.01, (b) 0.05 显 着 性 水 平 下 检验 假设 : 
物理 成 绩 与 数学 成 绩 是 相互 独立 的 . 





为 确定 司机 年 龄 是 否 会 影响 到 交通 事故 的 发 生 次 数 ,对 此 进行 了 一 项 调查 , 其 结果 由 表 12.23 给 出 . 
在 显著 性 水 平 (a) 0.01, (b) 0.05 下 检验 假设 :事故 发 生 次 数 与 司机 年 龄 无 关 . 在 抽样 方法 及 其 他 要 
考虑 的 原因 中 有 哪些 会 影响 到 你 的 结论 ， 


21—30 | 31~40 41—50 51—60 | 61~70 
60 1 6 


7 7 
5 6 
























(а) 证 明 对 所 有 列 联 表 都 有 x? = Sloe) — N, 其 中 N 为 所 有 单元 的 总 频数 . 

(b) 用 (a) 的 结论 讨论 习题 12.41. 

EF N,’ №, 分 别 表 示 一 列 联 表 的 第 ; 行 和 第 7 列 的 理论 频数 之 和 (边缘 频数 ), 证 明 第 ; 行 第 7 列 的 
单元 理论 频数 为 N,N,/N, 其 中 N 是 所 有 单元 的 总 频数 、 

证 明 本 章 公式 (9). (提示 :用 习题 12.43 和 12.44) 

把 本 章 公式 (9) 的 结果 推广 至 2x& 列 联 表 , 其 中 区 3 

证 明 本 章 公 式 (8). 

类 似 h Xk 列 联 表 的 一 些 想法 ,讨论 xkx1 列 联 表 的 情形 , 并 指出 它们 可 能 的 用 途 . 





列 联系 数 
12.49 表 12.24 给 出 了 200 个 学 生 头 发 与 眼睛 颜色 间 的 关系 . 


(а) 分 别 用 和 不 用 Yates 的 修正 求 列 联系 数 . 
(b) 将 (a) 的 结论 与 列 联 最 大 系数 作 比 较 . 


表 12.24 





12.50 ”分别 用 和 不 用 Yates 修正 求 (a) 习题 12.36, (b) 习题 12.38 中 数据 的 列 联系 数 . 
12.51 求 习题 12.41 中 数据 的 列 联系 数 . 


12.52 证 明 :3x3 表 的 最 大 列 联系 数 约 为 2. = 0.8165. 
12.53 证明; 对 x&k 表 的 最 大 列 联系 数 为 V (k —1)/Ь. 


属性 相关 


12.54 RE 12.24 中 数据 的 相关 系数 . 

12.55 分 别 用 和 不 用 Yates 修正 求 (a) 表 12.18 和 (b) 表 12.19 中 数据 的 相关 系数 . 

12.56 Ж 12.22 中 数学 与 物理 成 绩 之 间 的 相关 系数 . 

12.57 #СЖЕх 表 的 列 联 系数 ,x 是 相应 的 属性 相关 系数 ,证 明 
r=C/vy(1-C)(k-1). 


xX” 的 可 加 性 


12.58 为 检验 假设 Hio 一 实验 进行 了 5 次 ,每 次 相应 自由 度 均 为 4, 所 得 x? 值 分 别 为 8.3,9.1,8.9,7.8 和 
8.6. 证 明 在 0.05 显著 性 水 平 下 , 单个 考虑 每 次 实验 ,不 能 拒绝 Ho 而 在 0.005 水 平 下 , 综合 实验 将 拒 
绝 Ho. 


第 十 三 章 ”曲线 拟 合 和 最 小 二 乘法 


变量 间 的 相互 关系 


通常 在 实际 中 ,两 个 (或 多 个 ) 变 量 间 党 存在 着 一 种 关系 .例如 ,一 成 年 人 的 体重 时 种 程度 
上 依赖 于 他 的 身高 ; 圆 的 周 长 与 它 的 半径 相关 ;一 种 给 定 气 体 的 压强 与 它 的 温度 体积 有 关 . 
通常 用 数学 式 子 来 表述 变量 间 的 这 些 关系 是 很 必要 的 . 


曲线 拟 合 


为 确定 相关 联 变 量 间 的 一 个 方程 ,首先 第 一 步 应 收集 一 些 数据 ,这些 数 据 也 就 是 考 虚 变 量 
的 相应 值 .例如 ,假设 以 X 和 YY 分 别 表示 成 人 的 身高 和 体重 , 则 N 个 个 体 的 样本 将 显示 其 身 
高 Xi, X2,，…，XN 及 相应 的 体重 YY，，…，YN. 

第 二 步 则 是 在 一 直角 坐标 系 上 摘出 这 些 点 :(X Yi), (X2, Ү,), ee, (Xn, YN). 这 一 组 点 
集 有 时 称 为 散 点 图 . 

从 这 个 向 点 图 ,通常 可 以 观测 到 一 条 接近 数据 的 光滑 曲线 , 这 样 的 曲线 称 为 近似 曲线 . 例 
如 在 图 13-1 中 ,数据 近似 一 条 直线 ,因此 我 们 说 变量 间 具 有 线性 关系 .然而 在 图 13-2 中 ,尽管 
变量 间 也 存在 一 种 关系 ,但 不 是 线性 关系 ,因此 我 们 称 之 为 非 线 性 关系 . 

这 种 求 适 合 所 给 数据 的 近似 曲线 方程 的 一 般 问 题 称 为 曲线 拟 合 . 


Y Y 





图 13-1 图 13-2 
近似 曲线 的 方程 


一 些 一 般 类 型 的 近似 曲线 及 其 方程 在 下 面 列 出 以 供 参 考 . 除 X 和 Y 外 的 其 他 字母 均 表示 
П.Е X 和 YY 分 别 表示 自 变 量 和 因 变 量 . 


直线 了 =ау+а,Х (1) 
抛物 线 或 二 次 曲线 Y =а,+а,Х + а„Х? (2) 
三 次 曲线 Y =ao + al 和 + а,Х? + а,Х? (3) 

四 次 曲线 了 =ao +alX + aX? + а,Х? + аҲ“ (4) 

n 次 曲线 Y =ap+ aX + aX? + + а„Х" (5) 


上 述 方程 的 右边 分 别称 为 一 次 .二 次 三 次 .四 次 ”次 多 项 式 .有 时 ,前 4 个 方程 所 定义 的 函数 
分 别称 为 线性 函数 .二 次 函数 .三 次 函数 和 四 次 函数 ， 
下 面 是 在 实际 中 经 常用 到 的 一 些 其 他 的 方程 : 


双 曲 线 Y = 1 at +aıX (6) 


Н = а 
арб+а+Х Ү 0 


指数 曲线 Y = ab” 或 logY = loga + (logp)X = ao + а; Х (7) 





几何 曲线 Y = 2Х 8 ІорҮ = loga + b(logX) (8) 


修正 指数 曲线 Y = ах +g (9) 
修正 几何 曲线 Y =аХ° +g (10) 
古 姆 波 欧 曲 线 Y = pq! 或 logY = logp + bx(logy) = а^ + g (11) 
修正 古 姆 波 茨 曲 线 Y = рд +h (12) 
ЖТИ Y = 或 地 = аЬ + р (13) 

Y = а + ai(logX) + а,(1оеХ)? (14) 


为 了 确定 哪 一 种 曲线 适合 , 最 好 能 获得 变换 变量 的 散 点 图 .例如 , 若 logY 与 X ЖА ， 
点 图 显示 线性 关系 , 则 应 有 (7) 式 的 形式 , 若 logY 与 logX 的 关系 散 点 图 显示 线性 关系 , 则 应 
有 (8) 式 的 形式 .有 时 为 了 更 容易 地 确定 采用 哪 一 种 曲线 ,通常 要 用 一 种 特殊 图 纸 .具有 单 对 数 
测度 下 的 图 纸 称 为 半 对 数 图 解 纸 , 具有 双 对 数 测度 尺 的 图 纸 称 为 对 数 -对 数 图 解 纸 . 


曲线 拟 合 的 徒手 法 
通常 由 个 人 的 直观 判断 来 画 一 条 拟 合 一 组 数据 的 近似 曲线 , 这 种 方法 称 为 曲线 拟 合 的 徒 
手法 .如 有 果 曲 线 方程 形式 是 已 知 的 ,那么 可 通过 选择 与 方程 中 心 常数 个 数 同样 多 的 点 来 求 出 该 


方程 的 常数 .例如 , 如果 曲 线 是 一 直线 , 则 需 两 个 点 ;如 果 曲 线 是 抛物 线 , 则 三 个 点 足够 了 .这 种 
方法 也 有 不 利之 处 , 即 不 同 的 观察 者 将 得 出 不 同 的 曲线 和 方程 . 





直线 
近似 曲线 的 最 简单 形式 就 是 直线 , 其 方程 可 写 为 
Ү = ao + а: Х (15) 
给 定 一 直线 的 任意 两 点 (Xi, Ү,), MCX Y2), 常数 ао, а 便 能 确定 .直线 的 最 终 方程 可 写 为 
Y- yi- | О (хх) у-у = mX- x) (16) 
其 中 
ҮҮ; 
"СХ, -Х, 


称 为 直线 的 斜率 , 代表 Y 的 变化 量 与 相应 X 的 变化 量 的 商 . 

当 方 程 写成 (15) 式 的 形式 时 ,常数 а, 即 为 斜率 mm .常数 ao 即 为 当 X=0 时 了 的 值 . 称 为 
Y 的 截 距 . 
最 小 二 乘法 

为 避免 在 构造 直线 , 抛物 线 或 其 他 一 些 拟 合 数据 的 近似 曲线 中 个 人 判断 的 不 同 , 有 必要 在 
“最 佳 拟 合 直线 "“ 最 佳 拟 合 抛物 线 ” 等 定义 上 取得 一 致 

考虑 图 13- 3， 其 数据 点 由 (Xi，Yi)， (X2，Y2 )，…，(XN， YN) 给 出 .对 某 一 给 定 的 X 值 如 
Xi Yi 与 Xi 所 对 应 的 曲线 上 的 值 必 存 在 一 定 的 差异 , 如 图 中 所 示 , 我 们 记 这 差异 为 Di, 有 时 
我 们 称 之 为 偏差 .误差 或 残 差 , 其 值 可 能 为 正 , 为 负 或 为 0. 同样 地 , 相应 于 值 X,, …， Ху, 我 们 
将 获得 D,,…, Dy. 

对 一 组 给 定 的 数据 拟 合 一 条 近似 曲线 C, 其 “ 拟 合 优 度 ” 可 用 数值 D? + D3 + .… + DA ЖЖ 
量 . 该 数值 小 ,表示 拟 合 得 好 ; 该 数值 大 , 表示 拟 合 得 差 . 因此 我 们 有 以 下 定义 

定义 ”在 一 组 给 定数 据 的 所 有 拟 合 曲线 中 , 若 某 曲线 使 得 D2 + D3 +… + D} 达到 最 小 ， 
则 称 该 曲线 为 最 佳 拟 合 曲线 . 

使 偏差 平方 和 D?+ D3 +... + р, 达到 最 小 这 一 要 求 称 为 最 小 二 乘 原理 ， 故 最 佳 拟 合 曲 线 








图 13-3 


也 称 为 最 小 二 乘 曲 线 .特别 地 ,具有 这 种 性 质 的 直线 称 为 最 小 二 乘 直 线 , 具有 这 种 性 质 的 抛物 
线 称 为 最 小 二 乘 抛物 线 等 . 

当 和 是 目 变量 , Y 是 因 变 量 时 , АН ЕВЕ Х.Х ЕЛКИ, Д ЕЕ тА 
修改 ,不 是 考虑 竖 直 偏差 ,而 是 考虑 水 平 偏差 ,也 相当 于 是 变换 一 下 X, Y 轴 . 这 两 种 定义 一 般 
都 会 导致 不 同 的 最 小 二 乘 曲线 .除非 特别 指明 ,以 下 我 们 都 将 X 作为 自 变 量 , Y 作为 因 变量 . 

也 可 以 通过 考虑 每 一 个 数据 点 到 曲线 的 垂直 距离 而 非 竖 直 距 离 或 水 平 距离 来 定义 最 小 二 
乘 曲 线 . 但 我 们 一 般 不 用 这 一 定义 . 


最 小 二 乘 直线 
接近 一 系列 点 (Xi， Yı), (X3, Y»), е, (Ху, YN) 的 最 小 二 乘 直 线 具 有 方程 形式 ， 
Y = ag + а: Х (17) 
其 中 常数 ао» 81 通过 同时 解 下 面 的 方程 来 确定 ， 
S Y =а№ + а, У\Х 
У\ХҮ = а0У\Х +а У\Х? 


这 两 个 方程 称 为 最 小 二 乘 直线 {17) 的 正规 方程 .方程 (18) 中 的 常数 ao ai 可 以 由 以 下 公式 求 
18; 


(18) 


, СҮ) х?) (21X)( 2 XY) 
° мУ\ х? – (У\х)2 
NX XY- (OX)( SY) 
NXX- (2 XxX) 

正规 方程 (18) 可 由 以 下 方程 记 住 ,第 一 个 方程 由 (17) 式 的 两 边 求 和 而 得 
(SY = D (ao+ aX) = aoN + ai3)X), 而 第 二 个 方程 则 是 先 用 X 去 乘 (17) 式 的 两 
边 再 求 和 而 得 ( 即 , У) ХҮ = >)Х(ао+а,Х) = aoyIX+alyX2) .注意 这 不 是 正规 方 
程 的 派生 , 而 仅仅 是 方便 记忆 的 一 种 方法 .另外 也 要 注意 在 方程 (18)、(19) 式 中 , 我 们 用 简便 
记号 > X， Уху SERET Уух, Уху 等 . 


找 最 小 二 乘 直 线 的 工作 有 时 可 以 通过 变换 数据 为 2 二- Х,у= Ү- Ү 而 得 到 简化 .这 

时 最 小 二 乘 直 线 的 方程 可 以 写成 (见习 题 13.15): 
,- [22] 
Ўл? 


(19) 


ау = 


У\ хү 
2 


或 у= | 





(20) 











特别 地 ,如 果 久 有》,X =0( 即 X=0), 则 (20) 式 可 写 为 
> XY 
Dx 

方 得 (20) 表 明 当 了 =0 时 y=0. 因 此 最 小 二 乘 直 线 通过 点 (X, Y), 该 点 称 为 数据 的 质心 
或 重心 . 

WREE X 是 因 变 基 而 不 是 自 变量 , 那么 我 们 改写 方程 (17) 为 :多 =66+ БҮ. ЦЕ 
iE, AIE X A Y 交换 一 下 , ао 与 ac; 分 别 以 bo, bi 代 蔡 , 则 依旧 成 立 . 但 最 小 二 乘 直线 一 般 情 
况 下 不 同 于 上 面 所 获得 的 直线 (见习 题 13.11 和 13.15(4)). 





Y= 了 + Х (21) 








非 线性 关系 

非 线性 关系 有 了 时 可 通过 一 适当 的 变量 变换 简化 为 线性 关系 (见习 题 13.21). 
最 小 二 乘 抛 物 线 

接近 一 系列 点 (Xi Y1),(X2,Y2),…, (Хк, YN) 的 最 小 二 乘 抛 物 线 具有 方程 ， 


Y = ау+а,Х + а,Х? (22) 
其 中 常数 a0, ai, as， 通过 同时 解 下 列 方程 来 确定 ， 
У =а№+а У\Х + а, Х? 
DJ XY =а0 УХ ta У\Х? + а, УХ? 
2) Х?Ү =а0У)Х? + а УХ? + а, У\Х* (23) 
此 方程 称 为 最 小 二 乘 抛物 线 (22) 的 正规 方程 . 
方程 (23) 事 实 上 是 由 方程 (22) 的 两 边 分 别 乘 以 1, X, X, 然后 再 对 两 边 求 和 而 得 , 故 很 容 
务 记 住 .这 种 技巧 可 以 推广 而 获得 最 小 二 乘 三 次 曲线 .最 小 二 乘 四 次 曲线 及 一 般 的 对 应 于 方程 
(S$) 的 最 小 二 乘 曲线 的 正规 方程 ， 
正如 最 小 二 乘 直线 中 的 情形 , 若 选择 X 使 之 满足 УХ = 0 或 变换 变量 x = X-X, у = 
Y -了 , 则 最 小 二 乘 曲线 也 可 获得 类 似 (20) 式 的 简化 . 


回归 


通常 ,基于 一 样本 数据 , 我 们 希望 通过 一 给 定 的 变量 X 的 值 来 估计 变量 的 值 .这 个 愿望 
可 以 通过 拟 合 样本 数据 的 最 小 二 乘 曲线 来 完成 .这 个 拟 合 曲线 称 为 Y з х 的 回归 曲线 , 这 
ERN Y 是 由 X 值 估计 得 到 的 . О 
ПИ МЕН) YERE 的 值 ,我们 将 用 到 和 关于 了 的 回归 曲线 , 事实 上 也 相当 
于 在 若 点 图 中 转换 变量 , 使 得 X 是 因 变 量 而 Y 是 自 变量 . 这 也 等 价 于 前 面 所 介绍 的 在 最 小 二 
乘 曲 线 的 定义 中 用 水 平 偏 益 代替 坚 直 偏差 ， 
一 般 来 讲 , Y 关于 X 的 回归 直线 或 曲线 不 同 于 X 关于 ү 的 回归 直线 或 曲线 . 


时 间 序 列 的 应 用 


ЕЖЕ X 是 时 间 , 则 数据 给 出 不 同时 间 的 ү 的 值 .按时 间 排 列 的 数据 称 为 时 间 序 列 . 
在 这 里 所 讨论 的 了 关于 XX 的 回归 直线 或 曲线 通常 称 为 趋势 直线 或 趋势 曲线 , 通常 被 用 于 估 
计 、 预 报 或 预测 . 
两 个 以 上 变量 的 问题 


两 个 以 上 变量 的 问题 往往 可 以 类 似 两 个 变量 的 问题 来 讨论 . 例如 , 在 变量 X, Y, Z 之 间 可 
能 存在 一 种 可 由 下 式 描述 的 关系 ， 


Z = ар+а)Х + а) Ү (24) 
这 个 方程 称 为 变量 X, Y,Z 之 间 的 线性 方程 . 
在 三 维 直 角 坐 标 系 中 , 这 个 方程 表示 一 个 平面 .样本 点 (Xi, Yi Zi), (X, Ya, DZ )，…， 
(Ху, YN, Zn) 可 能 不 会 “散布 "在 这 个 平面 上 ,但 又 很 接近 这 个 平面 ,我 们 称 之 为 近似 平面 . 
通过 推广 最 小 二 乘法 , 我们 可 以 得 到 接近 数据 的 最 小 二 乘 平面 . 如 果 我 们 从 给 定 的 X, Y 
值 来 估计 2 的 值 , 那么 该 平面 称 为 Z 关于 X, Y 的 回归 平面 . 对 应 于 方程 (24) 的 最 小 二 乘 平 面 
的 正规 方程 由 下 式 给 出 : 
DZ =а№+а У) Х+а,У\Ү 
ХУ) XZ =a0 УХ +a, X? + а, У\ХҮ 
> Ү2 =a) Ү+а, У\ХҮ+а,У\ ү? (25) 
〈23) 式 同样 可 通过 对 (24) 两 边 分 别 乘 以 1, ХҮ, 然后 再 求 和 而 得 . 
比 (24) 式 更 复杂 的 方程 同样 也 可 以 讨论 , 这 些 都 称 为 回归 ( 曲 ) 面 . 若 变量 数目 超过 3 个 ， 
则 直观 上 将 难以 讨论 , 因为 此 时 我 们 需要 在 四 维 .五 维 甚 至 更 高 维 空间 中 来 讨论 . 
从 两 个 或 更 多 变量 来 估计 某 一 变量 的 问题 称 为 多 重 回归 , 这 些 将 在 第 十 五 章 中 有 更 详细 
的 介绍 . 


习题 及 解答 
直线 


13.1 (a) 构造 一 直线 使 其 与 表 13.1 所 给 数据 接近 . 
(b) 求 这 条 直线 的 方程 . 





E EE (EA, 1), (3,3), (5,7), (7,11), 
(9,15) 和 (10,17) 描 在 一 直角 坐标 系 上 ,如 图 13- 
4 所 示 . 显 然 所 有 的 点 都 在 一 条 直线 上 , 因此 该 
直线 完全 拟 合 这 些 数据 . 

(b) 为 确定 直线 的 方程 

Y = аб + а} Х (26) 
只 需 给 出 两 个 点 即 可 .选择 点 (2,1) 和 (3,3) 分 别 
代入 (26) 式 , 则 有 


1 = ag + 2а (27) 
3 = ао + За, (28) 
同时 解 方程 (27), (28) 得 а= -3,a;=2. 因 此 所 





求 方程 为 
Y=2X-3 或 Y=-3+2X 
同时 我 们 也 可 证 明 点 (5, 7), (7,11), (9, 15) 和 
(10, 17) 也 满足 该 方程 , 即 在 该 直线 上 . 
13.2 在 习题 13.1 中 , 求 (a)X=4 时 ,YY 的 值 , (b)X=15 5], Y 的 值 , (c)X =0 时 , Y 的 值 ， 
(d) Y =7.5 时 ,XX 的 值 , (e)Y =0 Rt, X MIE, (ғ) X 增加 一 个 单位 时 , Y 的 增 量 . 
# кє 把 已 知 值 代入 方程 Y=2X 一 3, 即 可 得 未 知 值 . (a)Y=5,(b)Y=27,(c)Y= -3, (d)X = 


图 13-4 


5.25, (exX=1.5,(0 当 和 从 2 增加 到 3,Y 从 2x2-3=1 增 加 到 2x3-3=3, 即 当 X 增 加 一 个 单位 
时 ,YY 相应 地 增加 2 个 单位 . 
YY 
Y — Yı = x, x,” Х,) 
(b) 求 过 点 (2, ~ 3) 和 (4,5) 的 直线 方程 . 


ЯЕ 8 和 (a) 直 线 的 一 般 方程 可 写 为 


Y = ау+а,Х (29) 
而 (Xu Ү,)Ж(Х,, Y2) 均 在 直线 上 , 故 满 足 
Y; = ау+а\Х\ (30) 
Үз = ao +t а Х› (31) 
(29) 式 减 (30) 式 得 
Ү-Үр= а,(Х - X,) (32) 
(31) 式 减 (30) 式 得 
Ү;-Үр=а(Х»-Х) 或 a= ху 


把 а, 的 值 代入 方程 (32) ,得 





证 毕 . 
Н н, RR Y 的 变化 量 与 相应 X 的 变化 最 的 商 , 称 为 直线 的 斜率 .所 求 方程 可 


写 为 :.Y-YI=m(X-X). 
(b) 解 法 一 ”用 (a) 的 结论 :XI=2,Yi= -3, Х,=4, Y, = 5, Н ЖӘ 


故 所 求 方程 为 :Y- Yi=m(X-XD), 或 Y-(-3)=4(X-2), 即 ,了 =4X-11， 
解法 二 ”用 直线 的 -- 般 方程 :Y= ao+ aiX, 把 点 (2, -3) 与 (4,$) 代 入 , Ша, =4,av= -11, 从 而 
得 方程 
Y= 4X-11 
13.4 对 习题 13.3(a) 的 结论 的 由 来 给 出 一 个 图 像 的 解释 . 
ИЕ ES 图 13-5 给 出 了 通过 点 P(X, Yi), Q(X,, Y;) 的 直线 ,点 R(X, YY) 表示 直线 上 的 任 一 点 . 
由 三 角形 PRT 与 三 角形 PQS 相似 可 得 


RT QS ẹ Y-Y, _ Y-Y, 
Y ТР SP 或 X XX, X, (33) 


然后 用 (X - XU) 乘 以 (33) 式 两 边 , 得 





Ү-Үр= УСУ (АХ х) 
即 得 直线 方程 . 
(33) 式 中 的 比值 为 斜率 m, 故 可 写成 
Ү-Ү,=т{(Х-Х,) 

13.5 对 过 点 (1,5) 和 (4, — 1) 的 直线 求 (a) 斜 率 ， 

(b) 方 程 , (c) Y ҤЕ, (d)X АЕН. 

解 F (a)Xi=1, Ү=5, Х,=4, Ү,= -1, 则 
图 13-5 斜率 






PX,Y ) 


负 的 斜率 表明 随 X 的 增加 ,YY 减少 ,如 图 13-6 所 示 . 


(b) 方 程 为 
Y- Y= m(X-X,) 


Bp 
Y 5= 2(X-1) 
或 
Y=7 
(c) Y УХ = ОН YAR n. Хон 
Y=7 %.7 


(d)X ВЕ ЉУ- ОВ ХНН. у Ү=0 8 
0 = 7-2Х, Х - 3.5 
13.6 求 半 行 于 直线 2X + 3Y =6 且 过 点 (4,2) 的 自 线 方 
fE. 图 13-6 
# E 若 两 直线 平行 , 则 其 斜率 相等 .从 方程 2X+3Y=6 得 Y=2- 之 X. 即 得 直线 的 斜率 为 吉 


3 
- _ 5. 因此 所 求 直线 方程 为 





Ү-Ү, 一 m(X— Xl) 
Вр 
Ү-2=- 20-4) 
或 
2X +3Y = 14 


NE ”和 平行 于 直线 2X+3Y=6 的 任 一 直线 方程 可 写 为 :2X+3Y= .将 X=4,Y=2 代 入 , 即 得 :< 
= 14. 故 所 求 方 程 为 :2X+3Y=14. 


13.7 求 一 直线 方程 , 使 其 斜率 为 - 4, Y 的 截 距 为 16. 
E F 在 方程 了 =ag+alX 中 ,av=16 为 Y 的 截 距 , al = -4 为 斜率 , 故 所 求 方程 为 


Y = 16-4X 
13.8 (a) 构 造 一 直线 使 该 直线 与 表 13.2 中 数据 接近 . 
(b) 求 该 直线 方程 . 
表 13.2 





| 

— 
pt 
— 
к= 
4+ 








# E Са) (1,1), (3,2), (4,4), (6,4), (8,5), (9,7), (11,8) 和 (14,9) 描 在 一 直角 坐标 系 上 ， 


如 图 13-7 所 示 ， 基 得 一 接近 这 些 数据 的 直线 .要 找 一 种 排除 个 人 判断 影响 的 方法 , 可 采用 最 小 二 乘 
法 ,见习 题 13.11. 





(b) 为 得 到 该 直线 方程 , 先 任 选 两 点 ,如 (0,1) 与 (12,7.5), 代 入 直线 一 般 方 程 Y= ao+ aizr, 求 出 ao = 
1, а, = 0.542, Е 780: Ү=1+0.542Х. 

13.9 (a) 比 较 近 似 直 线 所 得 Y 值 与 表 13.2 中 所 给 的 Y 18. 
(b) 当 X=10 时 ,估计 YY 的 值 . 
解 БЕ (a) 对 X=1,Y=1+0.542x1=1.542 或 1.5, 对 X=3,Y=1+0.542Xx3=2.626 或 2.6. 
对 于 X 的 其 他 值 可 同样 得 到 相应 的 Ү 值 .由 方程 Y=1+0.542X 所 估计 的 了 值 , 记 为 Y_ .这 些 估 
计 值 与 实际 值 由 表 13.3 给 出 ， 


表 13.3 
X 1 3 4 6 8 9 11 14 
ү 1 2 4 4 5 7 8 9 


(b) Х=10 时 , Ү=1+0.542 х 10= 6.42 8 6.4. 
13.10 从 某 一 州立 大 学 一 年 级 学 生 中 随机 抽取 12 名 男生 ， 测 出 他 们 的 身高 和 体重 , 如 表 13.4 


所 示 
表 13.4 
身高 X( 英 寸 ) | 70 63 72 60 66 70 74 65 62 67 65 68 
体重 Y( 磅 ) |155 150 180 135 156 168 178 160 132 145 139 152 
(a) 作 出 这 些 数据 的 散 点 图 . 


(b) 构 造 一 接近 数据 的 直线 . 

(c) 求 (b) 中 所 构造 直线 的 方程 . 

〈d) 已 知 某 学 生 身 高 为 63 英寸 , 估计 该 学 生 的 体重 . 
(e) 已 知 某 学 生体 重 为 168 磅 , 估计 该 学 生 的 身高 . 
BO EF (a) 散 点 图 如 图 13-8 所 示 . 


Y 





60 62 64 6 68 70 72 74 76 
Я® ОЖ) 


图 13-8 


(b) 直 线 亦 如 图 13-8 所 示 , 只 是 所 有 可 能 直线 中 的 一 条 
(c) 选 择 点 P(60,130), 0(72,170),48 m — 170—130 _ 号 ，, 则 方程 为 





72-60 


Ү — 130 = W(x - 60) 


В] 


(а)# Х = 63, 则 Y = 12 63 — 70 = 140 8. 


(e) Æ Y = 168, 则 168= 10х -70, X =71.4 或 71 英寸 . 


最 小 二 乘 直 线 
13.11 对 习题 13.8 中 数据 拟 合 一 最 小 二 乘 直 线 , 其 中 (a)X 作为 自 变量 , (bX 作为 因 变 量 . 
# E (a) 设 直线 方程 为 Y=ao+aliX, 其 正规 方程 为 


УУ = а№+ а У\Х 


У) ХҮ = а, У\Х +а У\Х? 
其 中 相应 的 求 和 的 值 由 表 13.5 给 











表 13.5 
1 1 1 1 | 1 
3 2 | 9 6 4 
4 4 16 16 16 
6 4 36 24 16 
8 5 64 40 25 
9 7 81 63 49 
11 8 121 88 64 
14 9 196 126 81 


УХ =56 YX’ = 524 У XY = 364 У ү? = 256 


因为 有 8 对 X,Y 的 值 , 故 N=8, 则 正规 方程 为 
Sap + 56a] = 40 
56ago + 524a; = 364 


同时 和解 方程 得 w = £, a= A 则 所 求 最 小 一 乘 直线 为 羡 - £ Zx 


11“) 
另 解 
А (È, YXJI х2) (O(NY) 40x524- 56x364 _ 6р. 
| мУ)\х?- (Ух) 8x524-56 11°" 
NŠ XY-(X) XXY) 8x364 56х40 了 
人 或 0.636 
NXX? - (У\Х) 8 x 524 - 56 11 
放 所 求 方程 为 Y= 名 + 二 XX. 
(bË X 为 因 变 量 ,而 Y 为 自 变 量 , 则 最 小 二 乘 直 线 为 X = bo+ b1Y, 其 正规 方程 为 
SX X=bN+b У\Ү 


У ХҮ =6,У)\ү+ь У\ү? 
由 表 13.5, 可 求 得 


故 所 求 直线 为 X = -六 + 区 
也 可 内 似 上 面 另 一 法 而 求 得 Бе, bi. 
注意 (〈a) 与 (b) 所 得 的 二 条 最 小 二 乘 直线 是 不 同 的 . 
13.12 对 习题 13.10 中 体重 /身高 数据 , 设 身 高 为 自 变 其 , 体重 为 因 变 量 ,用 Mimtab 求 最 小 
二 乘 直线 , 并 把 观察 的 数据 与 最 小 二 乘 直线 上 相应 的 点 标 在 同一 坐标 系 上 . 
Ж ES Mimtab 输出 结果 如 下 .命令 regress cz on 1 variable in cl 显示 出 最 小 二 乘 直线 方程 , weight 
= —60.7+ 3.22 height. 为 了 充分 欣赏 计算 软件 的 能 力 , 参见 寻求 最 小 二 乘 直线 的 必要 的 计算 方法 ， 
如 习题 13.17 给 出 的 那样 . 
MTB > print cl с2 
Data Display 


Row height weight 
1 70 155 
2 63 150 
3 72 180 
4 60 135 
5 66 156 
6 70 168 
7 74 178 
8 65 160 
9 62 132 

10 67 145 
11 65 139 
12 68 152 


МТВ > regress c2 оп 1 variable іп cl 

Regression Analysis 

The regression equation is 

weight = — 60.7 + 3.22 height 

在 图 13- 9 中, 观察 数据 值 用 方 框 表 示 , 最 小 二 乘 直 线 上 的 相应 点 用 + 字符 号 表示 . 


180 О 


Ф 
+ 
170 о 
+ 
160 О + 
E о + o 
є + o 
150 o + 
o 
140 + + О 
О 
+ О 
130 一 一 一 一 一 
60 65 70 75 
身 高 
图 13-9 


13.13 《〈a) 证 明 习 题 13.11 中 所 得 的 两 条 最 小 二 乘 直 线 相交 于 点 ( 闷 . 立 )， 
(b) 当 X=12 时 , 求 了 值 . 
(04 Y=3 н, X Ë. 


13.14 


13.15 





因此 称 为 质心 的 点 (X, Y) 为 点 (7,5). 
(a) 气 (7,S) 满 足 方 程 :Y= ity, Вр, 5-30 +17х7. 点 (7,5) 也 满足 方程 ;:X = 


11 11 
__д1, 32 
7= 2 + 2 х 5, 
pH HHEH.: 
6 2 


= Хех = - 5 ү 


11 
ЖЇН Х=7, Ү=5 a 5). 


(b) 将 X=12 代入 直线 ү = 6. х, 得 Y=8.2. 


(c) 将 Y=3 代 入 直线 X= - 方 + 六 YY Y, 得 X=4.0. 
证 明 最 小 二 乘 直线 总 是 通过 点 (X, Y). 
解 F 情形 1 (X 是 自 变 量 ) 最 小 二 乘 直线 方程 为 


Y = ао + aıX 


2 


其 正规 方程 之 一 为 


У! Y = а№+а} > xX 
将 (35) 式 等 号 两 边 同 时 除 以 м, 则 得 


(34) 式 减 去 (35) 式 ,得 
Y-Y=ai(X-X) 
即 表 明 直 线 通 过 点 (X, Y). 


Д. 
22 


+- Ү, Вр, 


(34) 


(35) 


(36) 


(37) 


情形 2 (Y 是 自 变 量 ) 同 情形 1, 只 需 交 换 X 与 Y 的 位 置 ,同时 分 别 将 cu, а, 用 Бо, Б, 代替 , 则 可 得 


到 方程 ， 
Х-Х= (У-Ү) 
从 而 说 明 直 线 通过 点 (X, 了 )， 
注意 , 直线 (37) 与 (38) 并 非 一 致 ,但 相交 于 点 (多 , 了). 
(a) 设 X 为 目 变 量 , 证 明 最 小 二 乘 直线 方程 可 写成 

















Е > лу 或 > xY 
у = ve)” g у = Уй? |“ 
К х=Х-Х,у=Ү-Ү. 
(b) 若 X=0, 证 明 (a) 中 最 小 二 乘 直线 方程 可 写 为 
122 ХҮ 
Ү = У) х? Х 








(С) Y 为 自 变 量 , 求 对 应 (a) 中 的 最 小 二 乘 直线 方程 . 
(d) 证 明 (a) 与 (c) 中 直线 未 必 一 样 . 
H єє (a) 方 程 (37) 可 写成 у=аух, АН г = Х-Х,у= Ү-Ү. 
由 正规 方程 (18) 解 得 ((19) 式 中 的 第 二 式 ) 
NO,XY - (OX)( DY) 
м У) х2 – (У\х)2 
NO (z+ Х)0у+ У) -IXet XD (y+ Ү)] 
м У! (= + Х)2 一 [> (zr +X 


dı = 


NO ley+a2Y+Xy+ Ӯ) – (У) + NX)( DS y+ NY) 
= 一 全 一- 一 -一 一 一- 人 一 一 人 人 人 LA 了 N+) 


NO) (22 + 22X + X?) - (z+ NX)? 


(38) 


CC Nury+NY2r+NXK>y+NXY-(>2r+NX)(>iy+NY) 
NŠ rz+2NX>r+N2X2-(>xr+NX) 
В Ух = У(Х - Х)= 0, ЖА Уу= 3(Y 一 了 )=0, 因 此 上 式 可 简写 为 
NO zy+N*XY - №ХҮ Уу 





4а} 一 






















































































МУ! 2 + МХ? – NX? 7 Dr 
或 
DE Dr(Y- Ү) 
C Ye Dr 
DrY- YO zx > zY 
De Dr 
由 (37) 式 知 最 小 二 乘 直线 为 y= ciz, 即 
y= Sry то > ,zy 
2 
(b) 若 X=0,x= X-X=X, 则 由 
У! хү 
у = Ут x 
得 
O [XXY — {XXY 
у = у? X 或 Y=Y+ E 
(c) 通 过 交换 X 与 或 x 与 y, 则 可 得 方程 
ЭЕ 
х = Ууз y 
(d) 由 (a) 知 方程 为 
Dzy 
У = Sr? T (39) 
由 (c) 知 方程 为 
_ | oy 
x£ = Уту? y 
或 
_ | 2ш» 
У = УУ) ту T (40) 
因为 一 般 
PEP >y 
Ха? Уулу 


故 直线 (39) 和 (40) 一 般 情况 下 是 不 同 的 , 然而 , 它们 相交 于 点 т=0,у=0(ВИН(Х,ү)). 
13.16 右 X=X+A,Y =Y+B, 其 中 A 与 B 是 任意 常数 ,证 明 . 
a= мхү- (Ух) У)ү) NĎXY- СХ) SY’) 
NŠ X – (У) X? NXX? - (OXP 1 
ШЕН ESF 
z =X -X =(X+A)-(X+A)=X-X=v 
Y-Y =(Y+B)-(Y+B)=Y-Y 
Sry E Sry 
Уе у 


由 习题 13.15, 即 可 得 证 结论 ,类似 的 结果 对 651 成 立 . 
这 个 结论 是 有 用 的 , 它 可 简化 回归 直线 的 计算 (见习 题 13.17 的 解法 二 ). 
FE, E X =с,Х +А,Ү' =с,Ү +B, ФА ЯЛ Л, АЗЕ с = о. 
13.17 对 习题 13.10 中 数据 拟 合 一 最 小 二 乘 直 线 , 其 中 设 (a)X 为 自 变 量 , (b)X 为 因 变量 . 


Ж БЕ 解法 一 (a) 由 习题 13.15(a) 结 论 , 知 所 求 直 线 为 
> ту 
Dal” 
其 中 zx=X-X,y= Y ~ 了 .一 些 涉及 和 的 计算 值 由 表 13.6 给 出 , 则 有 
X = 802/12 = 66.8, Ү = 1850/12 = 154.2. 





У = 








XRT » | = 
70 155 ENRETE 10.24 0.64 
63 150 15.96 14.44 17.64 
72 180 27.04 665.64 
60 135 a na ТЫ 46.24 368. 64 
ЖЕТЕКТЕ 10.24 190.44 


51.84 566.44 


23.04 492.84 


65 139 27.36 3.24 231.04 


S TF 之 > 
= 616.32| 191.68 |= 2659.68 


z = 3,22хт 


СХ 
СХ 
= 
л 
© 


ч |ы 
e | > 
— | p 
~] | С 
© | 的 
ч ро 
кә 
бә 
ө 
oo 
p= 
ч 
一 
оз 
[=] 


© 
ә 
к 
ыз 
Мә 
) 
> 
oo 
і 
М 
№ 
ко 
к= 
с 
© 
GA 
ем 


УХ = 802 | У) Y = 1850 


Х = 66.8 Ү = 154.2 


Е: 


则 所 求 直 线 为 





或 写成 
Y – 154.2 = 3.22(Х ~ 66.8) 或 Y = 3.22X -60.9 
该 方程 称 为 Y 关于 XX 的 回归 直线 , 用 于 对 给 定 X 值 估计 Y 值 . 
(DE X 是 因 变 量 , 则 方程 为 


дулу |) 
У» 


_ 616.32 


= 2659.68% 7 0232y 








也 可 写成 
X = 31.0 +0.232Y. 
该 方程 称 为 X 关于 Y 的 回归 直线 , 用 于 对 给 定 Y 值 估计 久 值 . 
注意 ,习题 13.11 中 方法 也 可 用 . 


解法 二 用 习题 13.16 的 结论 ,我 们 可 以 从 义 与 Y 中 减 去 适当 的 常数 .我 们 选择 从 X 中 减 去 65, 从 
Ү PRE 150, 则 结论 可 以 写成 如 表 13.7 所 示 . 


Me2XY-(2X)C2Y) 12x708-22x50 ，， 
NŠ X?- (DXF 12 x 232 -22 7 


„ NAX Y ~-(2Y)CZXD) 12x708- 50x22 
NX Y?-(D YP 12 x 2868 — 50? 


位 1 一 


= 0.232 


5 Х=65+22/12= 66.8, Ү = 150 + 50/12 = 154.2, 977 5 
Y — 154.2 = 3.22(Х - 66.8) 和 Х 66.8 = 0.232(Үү – 154.2), 
即 为 Y=3.22X-60.9 和 X=0.232Y+31.0, 这 和 解法 -- 中 结论 -…- 致 . 








表 13.7 

х ү? 
5 5 25 25 
-2 0 0 
7 210 900 
-5 75 | 225 
1 6 36 
5 90 324 
9 252 784 
0 0 100 
-3 54 324 
2 -10 25 
0 0 121 


13.18 〈a) 在 同一 坐标 系 里 , 就 习题 13. 17 中 数据 画 两 条 直线 . 
(b) 和 大 已 知 身高 为 63 英寸 , 求 体重 为 多 少 ? 
(c) 乔 已 知 体重 为 168 В, 求 身 高 为 多 少 ? 
EO E (a) 两 条 直线 画 出 如 图 13- 10 所 示 , 两 直线 相交 点 (到 ,了 了 ) 即 (66.8,154.2). 
(b) H Y XFX 的 回归 直线 Y=3.22X -60.9, 当 义 =63 时 ， 


Y=3.22x 63-60.9=142. 
(co) 由 XX 关于 Y 的 回归 直线 X=31.0+0.232Y, 当 Y=168 时 ， 


X=31.0+0.232 x168= 70.0. 





60 62 64 66 68 70 72 74 76 
FA GT) 


图 13-10 
时 间 序 列 的 应 用 


13.19 美国 从 1989 年 到 1995 年 ， 农场 实际 土地 总 值 (用 10 亿美 元 计算 ) 如 表 13 8 所 示 . 用 
统计 软件 ; 


(b) 求 拟 合 这 些 数 据 的 最 小 二 乘 直线 方程 ; 
(c) 佑 计 美 国 1988 年 农场 实际 土地 值 ,并 和 其 实际 价值 6268 亿美 元 做 比较 ; 
(d) 佑 计 美 国 1996 年 农场 土地 价值 , 并 和 其 实际 值 8597 亿美 元 作 比 较 . 


Æ 13.8 
年 份 1989 1990 1991 1992 1993 1994 1995 
总 值 660.0 671.4 688.0 695,5 717.1 759.2 807.0 


来 源 : 美 国 农业 部 经 济 调 查 部 . 


解 EF (a) 表 13.8 的 数据 图 如 图 3-11 中 实 线 所 永 , 图 中 虚线 为 最 小 二 乘 直 线 . 





1988 1989 1990 1991 1992 1993 1994 1995 1996 
年 份 


图 13-11 美国 农场 实际 土地 总 值 (10 亿美 元 ) 


(b) 最 小 二 乘 直线 的 解 由 以 下 Minitab 给 出 . 
Data Display 


Row Year Value 
1 1989 660.0 
2 1990 671.4 
3 1991 688.0 
4 1992 695.5 
5 1993 717.1 
6 1994 759.2 
7 1995 807.0 


MTB > regress c2 on 1 variable in cl 
Regression Analysis 
The regression equation is 
Value = – 45222. 914286 + 23.060714 Year 

R 13.9 给 出 了 表 13.8 中 数据 的 拟 合 值 和 残 差 .把 年 份 代入 最 小 二 乘 直线 的 回归 方程 中 可 求 出 
拟 合 值 .例如 , – 45222.914286 + 23.060714 х 1989 = 644. 846. 用 实际 的 值 减 去 拟 合 值 即 得 残 差 . 残 
差 说 明了 最 小 二 乘 直线 与 实际 数据 的 拟 合 情 况 . 









644.846 15.1536 









1990 667.907 3.4929 
1991 690.968 – 2.9679 
1992 714.029 - 18.5286 
1993 737.089 – 19.9893 
1994 760.150 – 0.9500 






783.211 23.7893 





通常 在 数据 分 析 前 要 对 年 份 进行 编码 .以 下 Minitab 程序 说 明 对 年 份 用 编码 值 的 分 析 . 


Data Display 


Row Year-coded Value 
0 660.0 
671.4 
688.0 
695.5 
717.1 
759.2 
807.0 


ч С мл e uv N me 
о л E шо Be e 


MTB > regress c2 on 1 variable in cl 
The regression equation is 
Value = 644.846 + 23. 061 Year-coded 
表 13.10 给 出 了 表 13.8 中 数据 对 年 份 进行 编码 后 的 拟 合 值 和 残 差 ， 


表 13.10 









644.846 15.1536 










1 667.907 3.4929 

2 690.968 -2.9679 

3 714.029 | – 18.5286 

4 737.089 | – 19.9893 

5 760.150 ~ 0.9500 
783.211 





23.7893 





4c) 在 (b) 中 得 到 的 最 小 二 乘 方程 可 用 来 估计 1988 年 农场 实际 土地 总 值 .对 年 份 没有 进行 编码 而 得 
的 方程 计算 得 到 - 452229.14286 + 230.60714 x 1988 = 6218 亿美 元 . 实际 值 为 6268 亿美 元 , 残 差 为 
6268 - 6218 = 5 亿美 元 .对 年 份 进 行 编码 而 得 的 方程 计算 得 到 6448.46-230.61x(-1)=6218 亿 
美元 .注意 在 此 编码 中 , 1988 记 为 -1.(d) 在 (b) 中 得 到 的 最 小 二 乘 方程 可 用 来 估计 1996 年 农场 实 
际 土地 总 值 .对 年 份 没 有 进行 编码 而 得 的 方程 计算 得 到 - 452229. 14286 + 230. 60714 х 1996 = 
8062.7 亿 美元 .实际 值 为 8597 亿美 元 , 残 差 为 8597 - 8062.7 = 534.3 亿美 元 . 对 年 份 进行 编码 而 得 
的 方程 计算 得 到 6448.46- 230.61x7=6062.7 亿美 元 . 注意 在 此 编码 中 , 1996 记 为 7. 

13.20 表 13.11 给 出 了 由 消费 价格 所 测定 的 购买 力 情况 . 
(a) 画 出 数据 图 . 
(b) 通 过 直接 计算 和 用 Minitab 求 趋势 直线 方程 即 拟 合 数据 的 最 小 二 乘 直线 方程 


(co) 假设 趋势 连续 ,预测 1998 年 的 购买 力 . 


表 13.11 


来 源 : 美 国 劳工 统计 局 ,新 近 商 业 调 查 . 













1989 


消费 价格 


消费 价格 





E EF (a) 如 图 13-12 所 示 , 实 线 为 表 13.11 的 数据 图 , ERJEN RER. 


0.99 S 
0.94 
0.89 
0.84 
0.79 
0.74 
0.69 
0.64 
0.95 


1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 
年 份 


购买 力 





图 13-12 


X) Y = 11.212 


Ү = 0.801 





2 ху 


Уа 


(b) 求 趋势 直线 的 计算 如 表 13.12 所 示 , 方程 为 = 7y, 其 中 zx=X-X,y= Y-Y, WF 








程 可 写成 
Y =- 0.0289X + 0.9889 
Minitab 解 如 下 所 示 . 编 码 值 X 在 СІ 列 , 购买 力 值 在 C2 列 . 
MTB > Кергеѕѕ Purchasing power 1 ‘Year; 
Regression Analysis 
The regression equation is 
Purchasing power = 0.989 – 0.0289 Year 
(с)1998 年 预计 购买 力 为 0.989 - 0.0289 х 15 = 0.556. 


表 13.13 
1983 1.003 0.989 0.014 
1984 | 0.961 0.960 0.001 
1985 0.928 0.931 -0.003 
1986 0.913 0.902 0.011 
1987 0.880 0.873 0.007 
1988 0.846 0.844 0.002 
1989 0.807 0.815 ~ 0.008 
1990 0.766 0.786 ~ 0.020 
1991 0.734 0.758 – 0.024 
1992 0.713 0.729 – 0.016 
1993 0.692 0.700 | -0.008 
1994 0.675 0.671 0.004 
1995 0.656 0.642 0.014 
1996 0.638 0.613 0.025 


可 简化 为 线性 形式 的 非 线性 方程 


13.21 表 13.14 给 出 了 一 给 定 气体 随 不 同体 积 值 V 所 相应 的 压强 PP. 由 热力 学 定理 ,P 与 V 
之 间 有 关系 式 :PV = С, 其 中 у 与 C 是 常数 
(DR y 和 C 的 值 ; 
(b) 写 出 关于 P Ууу 的 方程 ; 
(c) 当 V=100.0 立方 英寸 时 ,估计 PP 的 值 . 


W 13.14 













体积 V( 立 方 英寸 ) 
压强 P( 磅 /平方 英寸 ) 





54.3 61.8 72.4 88.7 118.6 194.0 








61.2 





49.2 37.6 28.4 19.2 10.1 





解 EF 由 PVvr=-C, 得 
logP + yiogY = lgC 或 logP = logC - ylogV 
令 log V =X, logP = Y, 则 上 述 方程 式 可 写 为 


Ү = аб + aX (41) 
其 中 ао =logC, a; = — yY. 


出 了 涉 


A 
R 


? 


对 应 表 13.14 给 出 的 了 与 已 值 , 表 13.15 给 出 了 X=log 与 了 =logP 的 值 ,同时 也 


及 最 小 


乘 直 线 (41) 式 的 计算 值 .对 应 方程 (41) 的 正规 方程 为 


— 
—— 


aoN + а, УХ 和 和 УХУ = ao) X+a ;>,Х? 


Y = 


>. 


= 4.20 


мух? (УХ)? 


(S) YOX- (У XNA XY) 
NŠ XY 


~ 1.40 


- (D2) XQ Y) 


мух? - (X X? 


因此 Y=4.20-1.40X. 


(a) 因 为 40 


1.40. 


-1.40= ~ у, С=1.60х 10“, у = 


оС, ау = 


| 


4.20 = 


16000. 
2, Y =logP = 4.20 - 1.42 х2= 1.40. Й] 


(DEER P, V ETEA PV 


(0) V=100 f, X 


= log V = 


= 10-4 = 25.1 磅 /平方 英寸 


Р 


13.115 


ХҮ 





上 一 JogV 


3.0997 


3.0095 


1.7348 


3.0350 


3.2077 


1.7910 


2.9294 


3.4585 


1.8597 


2.8309 


3.7943 


1.9479 


2.6617 


4.3019 


2.0741 


2.2976 


5.2340 


2.2878 


16.8543 


uN 
[~ 
с^ 
ГУ. 
的 


SY 


ЭХ = 11.6953 
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图 13-13 


13.22 在 对 数 - 对 数 图 解 纸 上 描 点 解 习 题 13.21. 
解 F 先 由 表 13.14 中 每 对 值 (P, V) 求 解 相 应 的 点 (logP,logVv). 再 将 这 些 点 画 在 对 数 - 对 数 图 
解 纸 上 ,如 图 13-13 所 示 . 然 后 画 一 直线 接近 这 些 点 .图 中 表明 在 logP 与 logV 之 间 存 在 线性 关系 ， 
并 可 表示 为 
logP = ao+allogV 或 Ү=ау+а,Х 

斜率 а, 是 负 的 ,数值 上 等 于 АВ 与 AC 的 长 度 比 ,可 得 a1= -1.4. 

为 得 到 ao, 需要 得 到 直线 上 的 一 点 .如 当 У = 100 8 Р = 25, №, ас = Р – ailogV = ор 25 + 
1.4108100=1.4+1.4х 2=4.2, 故我 们 有 logP +1.4logV =4.2,logPV!4=4.2, 即 PV14= 16000. 


最 小 二 乘 抛物 线 


13.23 表 13.16 给 出 了 美国 1950 到 1995 年 的 总 人 口 数 ,以 5 年 为 一 阶段 ， 单位 以 百 万 计算 . 
对 这 些 数据 拟 合 一 直线 ,同时 拟 合 一 抛物 线 , 对 它们 进行 评论 , 用 两 种 模型 来 预测 美国 
2000 年 的 人 口 数 . 


表 13.16 
年 份 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 
Ап 152 166 181 194 205 216 228 238 250 263 
来 源 :美国 调查 局 . 


Ж EF 由 Minitab 输出 的 最 小 二 乘 直 线 和 最 小 二 乘 抛物 线 如 下 所 示 ， 


Row Year Population x xsquare 
1 1950 152 0 0 
2 1955 166 1 1 
3 1960 181 2 4 
4 1965 194 3 9 
5 1970 205 4 16 
6 1975 216 5 25 
7 1980 228 6 36 
8 1985 238 7 49 
9 1990 250 8 64 

10 1995 263 9 81 


MTB > Regress population ' on 1 predictor ‘x 
. Regression Analysis 
The regression equation is 
Population = 155 + 12.0 x 
MTB > Regress ' population ' оп 2 predictors ‘x 'xsquare’ 
Regression Analysis 
The regression equation is 
Population = 153 + 13.6 x - 0.17.8 xsquare 
Ж 13.17 给 出 了 直线 拟 合 值 和 残 差 ， 


表 13.17 






155.164 -3.16364 
1955 167.194 - 1.19394 
1960 179.224 1.77576 






191.255 2.74545 






直线 


13.24 


13.25 
13.26 


13.27 
13.28 


13.29 
13.30 
13.31 


最 小 二 


13.32 


续 表 





cr 


203.285 





1.71515 








1975 215.315 0.68485 
1980 227.345 0.65455 
1985 239.376 -1.37576 
1990 251.406 – 1.40606 









263.436 





– 0.43636 


表 13.18 给 出 了 抛物 线 拟 合 的 拟 合 值 和 残 差 .直线 的 残 差 平方 和 为 30.024, 抛物 线 的 残 差 平方 
和 为 13.289. 显 然 ,抛物 线 拟 合 数据 比 直线 拟 合 得 好 . 


表 13.18 


Ло | дай | 














153.027 - 1.02727 
1955 166.482 -0.48182 
1960 179.580 1.41970 
1965 192.323 1.67727 
1970 204.709 0.29091 
1975 216.739 - 0.73939 
1980 228.414 — 0.41364 
1985 239.732 — 1.73182 
1990 250.694 — 0.69394 

261.300 1.70000 






为 了 预测 2000 年 人 口 数 ,要 注意 2000 的 编码 值 为 10. 直线 的 预测 信 为 155 +12.0х10= 2.75 亿 人 ， 
用 抛物 线 模型 预测 的 结果 为 133+ 13.6x10-0.178x100=2.712 ZA. 


补充 习题 


若 3X+2Y=18, 求 (a) 当 Y=3 时 XX 的 值 ,(b) 当 多 =2 时 了 的 值 ,(o) 当 Y=-5 时 多 的 值 , (d)X = 
-1 时 Y 的 值 , (e)X 的 截 距 , (G) Y 的 截 距 . 

在 同一 坐标 系 内 , 画 出 方程 (a)Y=3X -5 和 (b)X+2Y=4 的 图 形 , 避 它们 相交 于 哪 一 点 ? 
(a) 求 通过 点 (3, - 2) 和 ( - 1,6) 的 直线 方程 ; 

(b) 求 (a) 中 直线 的 Х 截 距 和 Y RE, 

(c) 分 别 求 对 应 X=3 和 X=5 的 Y 的 值 ; 

(d) 直 接 从 图 形 证 明 (a),(b),(c) 的 结论 . 

求 斜率 为 字 ,Y 截 距 为 - 3 的 直线 方程 

(a) 已 知 方程 为 3X -5Y = 20, 求 其 斜率 和 Y RE. 

(b) 求 与 (a) 中 直线 平行 且 通 过 点 (2, - 1) 的 直线 方程 . 

对 通过 点 (5,4) 和 (2,8) 的 直线 , 求 (a) 斜 率 , (b) Y 截 距 , (ce) 直 线 方程 . 

Ж ОХ 截 距 与 Y 截 距 分 别 为 3 和 - 5 的 直线 方程 . 

已 知 100 摄氏 温度 (100C ) 相 当 于 212 华氏 温度 (212 灾 ), 0С 相当 于 32 下 ,假设 摄氏 温度 与 华氏 温度 
间 存 在 线性 关系 , 求 (a) 该 直线 方程 ,(b) 对 应 ВОС 的 华氏 温度 , (对 应 68 下 的 摄氏 温度 . 


乘 直线 


对 表 13. 19 中 数据 拟 合 一 最 小 二 乘 直线 , 其 中 设 (a)X 为 自 变量 , (bjX 为 因 变 量 .在 同一 坐标 系 上 画 
出 数据 点 和 直线 . 


13.33 ”对 习题 13.32 中 数据 , 求 (a) 当 X=S5 和 和 X=12 时 相应 的 了 值 ,(b) 当 Y=7 时 X 的 值 . 
13.34 《〈a) 用 徒手 方法 , 求 拟 合 习 题 .13.32 中 数据 的 直线 方程 ;(b) 用 (a) 中 的 结论 , 回答 习题 13.33 中 问题 . 
13.35 表 13.20 给 出 了 从 一 大 群 学 生 中 随机 抽取 的 10 名 学 生 的 代数 与 物理 的 期 末 成 绩 . 

(a) 画 出 数据 图 |; 

(b) 设 X 为 目 变量 , 求 拟 合 这 些 数据 的 最 小 二 乘 直线 ; 

(c) 设 Y 为 目 变 量 , 求 拟 合 这 些 数据 的 最 小 二 乘 直线 ; 

(d) 若 一 学 生 代 数 成 绩 为 75, 则 他 的 物理 期 望 分 为 多 少 ? 

(е) 若 一 学 生物 理 成 绩 为 95, 则 他 代数 的 期 望 分 为 多 少 ? 


ЗЕ 13.20 


13.36 313.21 #8 1990—1996 年 间 每 1000 人 的 出 生 率 . 
(a) 画 出 数据 图 ; 
(b) 求 拟 合 数据 的 最 小 二 乘 直线 , 把 1990 到 1996 年 记 为 0 到 6; 
(c) 计 算 趋 势 值 ( 拟 合 值 ) 和 残 差 ; 
(d) 假 设 目前 趋势 连续 , 预测 2000 FHER. 


表 13.21 
年 份 1990 1991 1992 1993 1994 1995 1996 
人 口 出 生 率 | 16.6 16.3 15.9 15.5 15.2 14.8 14.5 
来 源 ; 美 国 调查 局 . 


13.37 表 13.22 给 出 美国 1985~ 1996 年 的 85 岁 及 以 上 的 大 口 数 (单位 以 千 记 ) 
(а) 画 出 数据 图 ; 
(b) 求 拟 合 数据 的 最 小 二 乘 直 线 , 把 1985 到 1996 记 为 数 0 到 11; 
(c) 计 算 趋 势 值 ( 拟 合 值 ) 和 残 差 ; 
(d) 假 设 目前 趋势 连续 , 预测 2005 年 的 85 岁 及 以 上 的 人 口 数 . 


表 13.22 
年 份 1985 1986 1987 1988 1989 1990 
85 少 及 以 上 | 2667 2742 2823 2885 2968 3022 
年 份 1991 1992 1993 1994 1995 1996 
85 УКЫ Е | 3185 3306 3431 3541 3652 3762 
来 源 :美国 调查 局 . 


13.38 对 表 13.23 中 数据 , 拟 合 一 最 小 二 乘 抛物 线 Y= aotaiX + а Х?. 


表 13.23 
X 0 1 2 3 4 5 6 


Ү 2.4 2.1 3.2 5.6 9.3 14.6 21.9 


13.39 


13.40 


13.41 
13.42 
13.43 


某 人 意识 到 危险 后 让 汽车 停 下 来 的 总 时 间 等 于 反应 时 间 ( 即 从 意识 到 危险 到 使 用 刹车 这 段 时间 ) 加 上 
刹车 时 间 ( 即 刹车 到 车 停 住 这 段 时 间 ). 表 13.24 给 出 了 汽车 从 司机 意识 到 危险 的 瞬时 , 其 速度 为 у, 
到 刹 住 车 所 跑 的 距离 D. 

(а) D 对 应 V 的 图 形 ; 

(b) 对 所 给 数据 拟 合 一 形式 为 Dagta Vta VARN ERAR, 

(c) 求 V=45 米 /小 时 和 V=80 米 /小 时 时 对 应 的 DD 值 . 


Ж 13.24 
速度 V( 米 /小 时 ) 20 30 40 S0 60 70 
刹车 距离 D( 英 尺 ) 54 90 138 206 292 396 


表 13.25 给 出 了 美国 1920~1980 年 间 男 性 和 人口 与 女性 人 口 数 ,以 10 年 为 一 阶段 . 

(a) 画 出 人 口 差异 图 ; 

(b) 求 拟 合 这 些 差异 数据 的 最 小 二 乘 直线 , 记 1920 到 1990 为 0 到 7; 

(c) 假 设 趋势 连续 , 估计 1995 年 人 口 差距 ,然后 与 实际 人 口 差距 5.75 作 比 较 . 问 是 否 表明 势 势 是 连续 
的 ? 


表 13.25 


年 份 1920 1930 1940 1950 1960 1970 1980 1990 
男性 人 口 | 53.90 62.14 66.06 75.19 88.33 98.93 110.05 121.24 
女性 人 口 51.81 60.64 65.61 76.14 90.99 104.31 116.49 127.47 

32 2.09 -1.50 -0.45 0.95 2.66 5.38 6.44 6.23 


来 源 :美国 调查 局 . 


用 男性 人 口 与 女性 人 口 的 比率 讨论 习题 13. 40. 
对 习题 13.40 中 差异 数据 拟 合 一 最 小 二 乘 抛物 线 . 
Ж 13.26 给 出 了 在 X 小 时 中 ,每 单位 容积 所 培育 的 细菌 数 Y 的 值 . 


表 13.26 
小 时 数 (XX) 





每 单位 容积 的 细菌 数 (了 ) 


(a) 在 半 对 数 图 解 纸 上 画 出 数据 图 ,对 Y 用 对 数 尺度 ,对 X 用 算术 尺度 ; 

(b) 对 数据 拟 合 一 形式 为 Y = ар" 的 最 小 二 乘 曲 线 ， 并 解释 这 特殊 方程 为 什么 产生 如 此 好 的 结果 ; 
(c) 把 从 方程 中 所 得 Y 值 与 实际 值 作 比 较 ; 

(d) 当 X=7 时 估计 Y 的 值 . 


13.44 在 习题 13.43 中 ,证 明 不 用 最 小 二 乘法 , 怎样 从 一 半 对 数 图 纸 上 的 图 得 到 所 需 方程 . 


第 十 四 章 相关 理论 


相关 与 回归 


在 上 一 章 中 ,我 们 讨论 了 从 一 个 或 多 个 相关 变量 ( 自 变量 ) 得 到 一 个 因 变 量 的 估计 或 回归 
问题 .本 章 我 们 将 进一步 讨论 变量 间 的 相关 程度 , 以 确定 一 直线 方程 或 其 他 方程 是 如 何 好 地 描 
述 或 表达 变量 间 的 关系 . 

若 变量 的 所 有 值 都 完全 满足 一 个 方程 , 则 说 这 些 变量 是 完全 相关 的 . 圆 的 周 长 C 与 半径 > 
有 关系 式 c =2xr, 因此 说 , 周 长 С 与 半径 - 是 完全 相关 的 . 铬 把 两 个 角子 同时 投 撕 100 次 ,其 
每 次 投 出 的 相应 点 之 间 没 有 任何 关系 (除非 这 些 投 撞 是 负重 的 ), 则 我 们 说 他 们 是 不 相关 的 .而 
像 人 的 身高 和 体重 这 样 的 变量 间 则 存在 某 种 关系 . 

当 只 考虑 两 个 变量 时 , 属于 单 相关 或 单 回 归 问 题 . 当 考 虑 两 个 以 上 变量 时 ,属于 多 重 相 关 
或 多 重 回归 问题 .本 章 我 们 只 考虑 单 相 关 问 题 , 多 重 相 关 或 回归 的 问题 将 在 第 十 五 章 讨论 . 


线性 相关 


若 考 虑 两 个 变量 X 和 Y, 散 点 图 给 出 了 (X,Y) 在 直角 坐标 系 中 的 位 置 . 若 散 点 图 中 的 所 
有 点 看 上 去 都 在 一 条 直线 附近 波动 ,如 图 14-1(a) 和 14-1(b) 所 示 , 则 称 变量 间 是 线性 相关 的 . 
此 时 , 正如 我 们 在 第 十 三 章 中 所 看 到 的 , 可 用 一 直线 方程 进行 回归 或 估计 . 

17 Y EZX 的 增加 而 增加 ,如 图 14-1(a), 则 此 相关 称 为 正 相关 或 直接 相关 ; 若 Y MEX 
的 增加 而 减少 ,如 图 14-1(b), 则 此 相关 称 为 负 相 关 或 逆 相 关 . 





Х Х 
(a) 正 线性 相关 (b) 负 线性 相关 (c) 不 相关 


图 14-1 


在 所 有 的 点 看 上 去 都 在 某 条 曲线 的 周围 波动 , 则 称 此 相关 为 非 线 性 相关 , 此 时 可 用 一 非 线 
性 方程 进行 回归 讨论 , 如 第 十 三 章 所 示 . 很 显然 非 线 性 相关 也 会 有 时 是 正 相 关 , 有 时 是 负 相 关 . 
如 图 14-1(с), 者 变量 间 没 有 显示 出 任何 关系 , 则 称 变量 间 不 相关 . 


相关 性 度量 


用 定性 的 方法 ,我 们 可 以 通过 观察 散 点 图 来 判定 用 一 给 定 直线 或 曲线 描述 变量 之 间 关 系 
的 好 坏 程度 .例如 , 比 起 图 14-1(b) 来 , 可 以 看 出 一 条 直线 能 更 好 地 描述 14-1(a) 中 X 和 了 的 
关系 , 因为 图 14-1(a) 中 的 直线 周围 的 点 的 分 散 程度 不 是 很 大 . 

如 果 想 用 定量 的 方法 来 讨论 样本 数据 关于 直线 或 曲线 的 散布 问题 , 则 有 必要 设计 一 种 相 
关 性 度量 方法 . 


最 小 二 乘 回归 直线 


我 们 首先 考虑 用 直线 描述 两 变量 之 间 关 系 的 好 坏 程 度 问 题 . 为 此 , 我 们 将 用 到 第 十 三 章 中 
所 得 到 的 最 小 二 乘 回 归 直 线 方程 .正如 我 们 所 看 到 的 , Y 关于 X 的 最 小 二 乘 回归 直线 方程 为 
Y = ау + а, Х (1) 
其 中 ae 和 а, 由 如 下 正规 方程 
УУ = а,№+а, У\Х б 
DAXY = а) Х+а У) х? 


计算 , 因此 
55у) L)-(Ņx)(E xy) 
м уух? - (5 x) 
„муху - (5х) Уу) 
мух (Sx) 
同 理 , X 关于 YY 的 最 小 二 乘 回 归 直 线 方程 为 
X =b tY (4) 


(3) 


其 中 bo 和 bi 由 如 下 正规 方程 
УХ = М +, У\Ү ©) 
5 
DXY = boDY+b YY 


计算 , 因此 
ху) [77) (Уху) 
муу - (DY) 
муху (Ух) (Уу) 
му) ү? – (SY) 
方程 (1) 和 (4) 也 可 分 别 用 如 下 形式 表示 
DE 
Ха" 
Еф х= Х-Х,у= үҮ- ү, 
当 且 仅 当 图 中 的 点 都 在 直线 上 时 , 这 两 个 回归 方程 才 相 同 , 此 时 , 我 们 说 X 与 Y 之 间 是 完 
全 线性 相关 


估计 的 标准 误差 


bo = 


(6) 
б; 


> ху 
ХУ»? 











和 | y (7) 


若 把 从 方程 (1) 中 由 给 定 的 和 估计 出 的 了 N Yao M Ү 关于 XX 的 回归 直线 的 散布 度 


量 由 
(Y- Ya) 
sx = y Lr- ray (8) 


给 出 , 称 为 了 关于 X 的 估计 的 标准 误差 . 
硅 采 用 回归 直线 (4), за хү 的 估计 的 标准 误差 


(X 加 X) 
ұу = (20-х) (9) 


一 般 说 来 ， $ү ХУС$у. ү. 


为 了 便于 计算 ,方程 (8) 一 般 写 成 下 列 形式 (见习 题 14.3): 
> O D) Yaa Y-a, ХҮ 
5үҳ М 
方程 (9) 也 有 类 似 的 表达 式 . 
估计 的 标准 误差 与 标准 差 的 性 质 类 做. 例如 , 若 在 与 回归 直线 相距 sy „,25у у, Зѕу x 处 分 
别 作 与 其 平行 的 直线 , 我们 将 发 现 , 若 N 足够 大 ,将 有 68% ‚95% ‚99.7% 的 样本 点 落 在 这 些 
平行 线 之 间 . 
修正 的 标准 差 


(10) 


~- JN 
5 = № – 5 


对 小 样本 数据 是 十 分 有 用 的 , 修正 的 估计 的 标准 误差 


~ М 
Sy x 一 N-2 ”YX 


也 有 如 此 作用 .因此 ,一 些 统计 学 家 在 定义 方程 (8) 或 (9) 时 一 般 用 N -2 替换 М. 
回归 平方 和 与 残 差 平方 和 


Y 的 总 变 差 定义 为 > (Ү— ҮРУ, Үү 与 均值 Y 的 偏差 的 平方 和 . 正如 习题 14.7 中 所 
示 , 总 变 差 还 有 如 下 表述 ， 
УКУ - У) = DY- ү) + YY -YY (11) 
уп) Зер Яп, 第 二 项 称 为 回归 平方 和 . ХН Y- YA 
确定 的 形式 , MAZ Y- Y。 则 是 随机 的 或 不 可 预见 的 .对 变量 X 也 有 相同 的 结论 . 


相关 系数 


回归 平方 和 与 总 变 差 之 比 称 为 判定 又 数 . 若 回归 平方 和 为 0, 则 比值 为 0; 若 残 差 平 方 和 为 
0, 则 比值 为 1. 也 就 是 说 比值 只 能 在 0 与 1 之 间 取 值 . 因 为 比值 总 是 非 负 的 , 我 们 一 般 把 它 记 
为 一 . 数 =- 称 为 相关 系数 , 由 下 式 表示 


_ ПЫН ИШ |De- YY 
"ОЯ 总 变 差 TH 2 (YY) 2) 


r 取 值 于 一 1 与 +1 208). +, 一 两 符号 分 别 用 来 表示 正 线性 相关 和 人 负 线 性 相关 .注意 + 是 一 无 
其 纲 的 量 , 没 有 单位 可 言 . 
由 (8) 式 和 (11) 式 , 可 知 Y 的 标准 差 为 


[> O -Y 
Sy = aY y (13) 


我 们 发 现 奉 不 考虑 符号 , (12) 式 可 以 写成 如 下 形式 


2 
$ 
= 1- — 或 


Sy 
把 X 和 Y 对 换 一 下 ,也 可 得 到 类 似 的 方程 . 
在 线性 相关 情形 中 ,不 管 X 与 Y 哪个 是 自 变量 , 数 > 都 是 一 样 的 .因此 说 + 是 两 变量 间 
线性 相关 的 非常 好 的 度量 . 


关于 相关 系数 的 附注 


(12) 式 和 (14) 式 中 定义 的 相关 系数 很 具有 一 般 性 , 既 可 用 于 线性 关系 ,也 可 用 于 非 线性 关 
系 ,其 惟一 不 同 之 处 是 Y。 是 由 一 非 线性 回归 方程 计算 求 得 而 不 是 由 一 线性 回归 方程 求 得 . 另 


$ү х = Sy 1 一 r? (14) 


外 在 非 线 性 关系 中 , + , 一 符号 也 可 和 忽略 .定义 估计 的 标准 误差 的 (8) 式 也 具有 一 般 性 .然而 ， 
(10) 式 只 能 用 于 线性 回归 . 奎 用 于 其 他 回归 , 则 必须 修正 一 下 .例如 , 奇 估计 的 方程 为 


Y = а+а,Х +а,Х* ++ +a, X°! (15) 
则 (10) 式 应 修正 为 
п-1 
‚ Y а-а ХҮ а, уу 了 (6) 
үх = М 


此 时 , 修正 的 估计 标准 误差 为 





sy x 一 (52 "SY х 
其 中 N-n 称 为 自由 度 . 


必须 强调 一 下 , 在 每 一 种 情形 中 所 计算 的 ~ 值 都 度量 了 相对 于 所 假设 的 方程 类 型 的 相关 
程度 .因此 , ERRA- ERDE, 而 方程 (12) 或 (14) 计 算 的 值 接 近 于 0, 这 意味 着 变量 间 几 乎 
没有 线性 关系 .然而 , 这 并 非 说 明 它们 之 间 不 存在 任何 关系 , 因为 变量 间 可 能 还 存在 高 度 非 线 
性 关系 . 换 句 话说 , 相关 系数 度量 的 是 假设 方程 和 数据 之 间 的 拟 合 优 度 . 除 非特 别 说 明 , 一 般 情 
况 下 ,相关 系数 即 指 线 性 相关 系数 . 

还 应 该 说 明 一 下 ,高 的 相关 系数 值 ( 即 接近 于 1 或 -1) 未 必 描 述 了 变量 间 的 一 种 直接 依赖 
关系 .例如 每 年 出 版 的 书 的 数目 与 每 年 的 暴风 十 的 次 数 之 间 可 能 存在 一 种 高 度 相关 .这 种 例子 
有 时 被 认为 是 伪 相 关 . 


线性 相关 系数 的 积 - 矩 公式 


知 假定 两 变量 间 存 在 线性 关系 , 则 (12) 式 可 写成 
>} ху 


r = -一 一 全 一 (17) 
J! У) 22) | УУ?) 
其 中 工 = 和 X-X,y= 工 -Y( 见 习题 14.10). 此 公式 称 为 积 - 矩 公式 , 它 直 接 给 出 了 ， 的 符号 ， 
还 清楚 地 表明 X 和 YY 的 对 称 性 . 


者 分 别 记 
т | r? 2 
w = 205, «= {д „(20 


= = (18) 


则 sx, sy 分 别 表示 变量 X 与 Y 的 标准 差 , 3 652, 是 它们 的 方差 .新 的 量 sxy 称 为 X 与 了 的 协 
方差 .用 (18) 式 中 的 记 法 , 公式 (17) 可 写成 














$ 
r 二 一生 一 (19) 


sx" SY 

注意 , r 不 仅 与 X 和 YY 的 单位 无 关 , 也 与 其 初始 值 无 关 . 
快捷 计算 公式 

公式 (17) 能 写成 以 下 等 价 形式 

o NX XY-(Xx) (XY) оо) 
ү{м$)х°-($)х)°].[м Ж ү?-(Уу)] 

—ЖЖНШЕЖИИ -( 见 习题 14.15 和 14.16). 

对 二 元 频数 表 或 二 元 频数 分 布 中 的 分 组 数据 (见习 题 14.17), 用 前 几 章 所 述 的 编码 方法 
计算 是 相当 便利 的 .此 时 , 公式 (20) 又 可 写成 

N У fuyuy Е | У) Лиу) 


„= У fyuy) (21) 
v LN 3) диз | Si fxux) 1. [N E уун, и | >) fyuy) | 


(见习 题 14.18) .为 了 计算 中 更 方便 地 使 用 公式 (21), 一 般 要 用 到 相关 表 ( 见 习题 14.19). 
对 分 组 数据 , 公式 (18) 可 写成 


2а _ | (22) 








>, /хих 
М 








u 
мү a frir x 


2 2 

SX TCX y liats p | faix 23) 
2 2 

wo 209 (Улаз (24) 


其 中 cx, су 分 别 表示 变量 X 5Y 的 组 距 宽度 (假设 是 常量 )、 
注意 , (23) 和 (24) 式 等 价 于 第 四 章 的 公式 (11). 
利用 结论 (22) ~(24) 式 可 看 出 ,公式 (19) 等 价 于 公式 (21). 











回归 直线 和 线性 相关 系数 
Y 关于 X 的 最 小 二 乘 回归 直线 了 = a。+ a,X 可 写成 
Ү-Ү=—“(х-х) 或 y= 21, (25) 
Sx Sx 
ЕЕ, X 关于 Y 的 最 小 二 乘 回 归 直 线 XX=6b6 + bY 可 写成 
Х-Х = 2Х(ү- ү) 或 х = Ху (26) 
Sy Sy 


SEHER r= +1 时 ,方程 (25) 和 (26) 的 斜率 相等 ， 此 时 , 这 两 条 直线 为 同一 条 直线 , 即 X 
与 了 之 间 存 在 完全 线性 相关 . 若 >=0, 则 两 直线 垂直 , X 与 Y 之 间 没 有 线性 关系 . 因此 线性 相 
天 系数 度量 了 两 直线 的 偏离 程度 . 

往 意 , 者 方 程 (25) 和 (26) 分 别 写成 了 = au + wjX,X = bot b1Y, 则 有 aibi=r*( 见 习题 
14.22). 


时 间 序 列 相关 


УЕ X 与 了 都 与 时 间 相 关 , UE X 5Y 之 间 有 可 能 存在 某 种 关系 , 尽管 这 种 关系 未 必 
是 一 种 直接 依赖 关系 ,也 可 能 是 某 种 “ 伪 相 关 ”. 通过 考虑 相对 于 不 同时 刻 的 (X, Y ) 值 , 与 通常 
一 样 利 用 上 面 公 式 ( 见 习题 14.28), 即 可 得 到 相关 系数 

也 有 可 能 某 个 时 刻 的 X 值 与 前 一 时 刻 的 X 值 存在 某 种 相关 ， 这 种 相关 通常 称 为 自 相关 . 


属性 相关 


本 章 中 所 讨论 的 方法 不 能 用 于 考虑 原本 是 非 数 值 的 变量 间 的 相关 性 ， 如 人 的 某 些 属性 ( 例 
如 头发 颜色 , 眼睛 颜色 等 ). 对 属性 的 相关 性 的 讨论 见 第 十 二 章 . 


相关 的 抽样 理论 


两 个 变量 X 与 Y 的 所 有 可 能 成 对 数据 构成 的 总 体 , 称 为 二 元 总 体 ， 一 般 情况 下 我 们 假定 
其 服从 二 元 正 态 分 布 . 现 从 中 抽取 N 对 数据 . 我 们 考虑 总 体 的 相关 系数 , 记 为 о, 其 值 由 样本 
相关 系数 > 估计 .关于 各 个 o 值 的 显著 性 检验 和 假设 检验 需要 有 ， 的 抽样 分 布 知识 .对 p =0， 
此 分 布 对 称 , 因此 要 用 到 ; 分 布 的 统计 量 ;对 о-©0, 分 布 具有 偏 性 , 此 时 由 Fisher 钱 究 的 一 种 
转换 将 产生 一 个 近似 正 态 分 布 的 统计 量 . 下 面 的 检验 概括 了 所 涉及 的 过 程 ; 
1.p =0 的 假设 检验 .此 时 要 用 到 这 样 一 个 事实 ， 即 统计 量 
t= к= (27) 


服从 自由 度 为 v= N 一 2 的 :分 布 (见习 题 14.31 9 14.32). 
2.р = ро £0 的 假设 检验 .此 时 要 用 到 这 样 一 个 事实 , 即 统 计量 


























2 = + =] = 1.1513log Ltr) (28) 
(其 中 e=2.71828…) 渐 近 于 正 态 分 布 ,均值 和 标准 差分 别 为 
_ 1, [1+ po _ 1 + pa | 1 
д; = Lial l-a] 1.1913iog To z= ЛҮ СЗ (29) 


3. 相关 系数 间 差 异 的 显著 性 . 为 了 确定 样本 容量 分 别 为 N 和 N, 的 两 个 样本 的 相关 系数 
ri 和 r 之 间 是 否 存在 显著 性 差异 ,我 们 必须 用 (28) 式 来 分 别 计算 相应 于 r 和 ,的 ZI 和 2, 
值 . 此 时 用 到 这 样 一 个 事实 , 即 检验 统计 量 
Zi- Z2- р; -Z 
z = l (30) 


服从 正 态 分 布 ( 见 习题 14.35), 其 中 


E 








Z-Z, 7 (22, + ор, YNi-3 N,-3 
回 妇 的 抽样 理论 


回归 方程 Y=ao+aliX 是 基于 样本 数据 得 到 的 .我 们 通常 对 相应 的 总 体 的 回归 方程 感 兴 
趣 . 下 面 给 出 了 关于 总 体 的 三 个 检验 ， 

1.a = А, 的 假设 检验 .为 检验 假设 :回归 系数 a 等 于 某 个 特定 值 A,, 需 要 用 到 这 样 一 个 
事实 , 即 统计 量 





а. = А 
t = -一 一 ү 22 (31) 


Sy.X/SX 
服从 自由 度 为 N -2 的 + 分布 .这 也 可 用 来 由 样本 值 求 总 体 回归 系数 的 置信 区 间 ( 见 习题 
14.36, 14.37). 
2. 对 预测 值 的 假设 检验 . 设 Yo 为 当 X 取 值 Xo 时 , 利用 样本 回归 方程 计算 出 的 Y 值 ( 即 
Yo 二 4a0t+ a1Xo), Yp 5°4 Х RE X, 时 总 体 Y 的 预测 值 , 则 统计 量 
Yo- Yp Yo— Үр 


t = = VN-2 =- — 
syx 4N+1+(X,- X) /sx syx 41 +1/N+ (Xo – Х)2/(№52,) 


(32) 





服从 自由 度 为 N -2 的 :分 布 .由 此 也 能 求 出 总 体 预测 值 的 置信 限 (见习 题 14.38). 
3. 对 预测 均值 的 假设 检验 . 设 Yo 为 当 X 取 值 X 时 ， 利用 样本 回归 方程 计算 出 的 Y 值 
(В Yo=ao+alX0o), Yp ЧХВЕ X, 时 总 体 Y 的 预测 均值 , 则 统计 量 
,= 5 2: ан (33) 
sy.x У1+(Хо- Х)2/52, sy.x Yl/N + (Xo — XY/(Ns}) 


服从 自由 度 为 N -2 г. 由 此 也 能 求 出 总 体 预测 均值 的 置信 限 ( 见 习题 14. 39). 


习题 及 解答 





散 点 图 和 回归 直线 
14.1 表 14.1 给 出 了 12 对 父 与 子 ( 大 儿子 ) 身 高 X 与 Y 的 样本 值 ,单位 为 英寸 . 


(а) 构造 散 点 图 ; 
(b) Ж Y 关于 X 的 最 小 二 乘 回 归 直 线 ; 
(с) 求 X 关 于 Y 的 最 小 二 乘 回 归 直 线 . 


表 14.1 
父亲 身高 X( 英 寸 ) 65 63 67 64 68 62 70 66 68 67 69 
儿子 身高 Y( 英 寸 ) 68 66 68 65 69 66 68 65 71 67 68 


解 F (а) 把 点 (X,Y) 描 在 直角 坐标 系 内 即 得 散 点 图 , 如 图 14-2 所 示 . 


Y 


72 Х=—3.38+1.036 Y P 
ө ^ 
70 Ф -一 


ө .一 
И 一 ө Y =35.82+0.476Х 
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62 64 6 6 70 72 
父亲 身高 (英寸 ) 


图 14-2 


(b) Y 关于 X 的 回归 直线 为 Y= ao+ alX, 其 中 a6 和 a, 通过 解 如 下 正规 方程 
S Y=aN+a DX 
DYXY = а У)Х + а, У\Х? 
可 得 . 求 和 的 值 由 表 14.2 给 出 .因此 上 述 方程 变 为 
12а, + 800а, = 811 
800а, + 53418а, = 54107 
通过 解 方程 可 知 a6 = 35.82,al=0.476. 故 Y=35.82+0.476X. 该 直线 见 图 14.2 
э | 
27у) (Ух) (Ух) (У) ху) 
мух? - ( Уух)” 
a -Nx (PX) УУ) 
мух? - (Bx) 
(с) X 关于 Y 的 回归 方程 为 X= bo+ b Y, HEF b, Mo 通过 解 如 下 正规 方程 
УХ = 6bN+b dy 
Ў) ХҮ = ь,У)Ү+ь, У) ү? 
得 到 .代入 表 14.2 中 的 数据 ,上述 方程 变 为 
12b, + 8116; = 800 
81160 + 548496, = 54107 
从 而 解 得 bo= 3.38, 6,= 1.036, X= 3.38 + 1.036 Y .直线 图 见 图 14-2. 


= 35.82, 


= 0.476 


71 


70 


为 解 








p LADLE YEE у 
муу? - (2 Y) 
b, „муху УУД У) Jx) = 1.036 
му) ү? - {У r) 
表 14.2 

Х y? 
65 4624 
63 4356 
67 4624 
64 4225 
68 4761 
62 4356 
70 4624 
66 4225 
68 5041 
67 4489 
69 4624 
71 4900 


14.2 H Minitab 求解 习题 14.1. 构 造 拟 合 值 Y。, 和 残 差 的 数据 表 .分别 对 两 条 回归 直线 求 残 
差 平方 和 . 


解 F 表 14.3 给 出 了 YY 关于 XX 的 回归 直线 的 拟 合 值 , 残 差 和 残 差 平 方 . 


表 14.3 





Y 关于 X 的 最 小 二 乘 回归 直线 的 Minitab 输出 如 下 ， 
MTB > Regress ‘Y’ on 1 predictor ‘X’ 
Regression Analysis 


The regression equation is Ү=35.8+0.476Х 
X XF Y KR ЖАА Minitab 输出 如 下 : 
MTB > Regress ‘X’ on 1 predictor ‘Y’ 
Regression Analysis 
The regression equation is X= 一 3.4+1.04Y 
表 14.4 给 出 了 X 关 于 Y 的 回归 直线 的 拟 合 值 , 残 差 和 残 差 平方 . 


表 14.4 





递 过 比较 残 差 平方 和 可 知 , Y 关于 X 的 最 小 二 乘 回 归 线 的 拟 合 值 要 比 X 关 于 Y 的 最 小 二 乘 回 
归 线 的 拟 合 值 好 得 多 .前 面 曾 讲 到 过 , 残 差 平方 和 越 小 , 回归 模型 和 数据 的 拟 合 就 越 好 .因此 可 知 , 由 
父亲 身高 来 估计 儿子 身高 显然 比 由 儿子 身高 估计 父亲 身高 更 合适 . 


估计 的 标准 误差 

14.3 ЖҮ 关于 X 的 回归 直线 为 Y= ao+ aiX, 证 明 估计 的 标准 误差 。 .由 下 式 给 出 ， 
> 20Ү - а Y-a, У) XY 
бүх 一 № 


Ж F 从 回归 直线 计算 的 Y 的 估计 值 为 Yet= ao+ aiX, 故 


DY-Y) У(Ү-ш-а,Х)? 
Sy.x 一 М 一 М 


_2ШҮ(Ү -ap -a,X) - ao) (Y -ау-а,Х)-а,У}Х(Ү-ау-а,Х) 
N 


但 
(У -ag-a,X)= DIY-aN- a У\Х = 0 
H. 
D X(Y-ag~a,X)= P XY-a ð X-a Ух? =0 
它们 是 从 如 下 正规 方程 推导 而 来 
X Y=aN+a У\х 
DXY = а,>)Х +а,У)Х? 
因此 
;OY(Y-ao-alX) ХҮ - а, УУ - а X XY 
YX N NN 


结果 可 以 推广 到 非 线 性 回归 方程 . 


该 
14.4 Ж х= Х-Х,у=Ү- Ү, ШЕН 14.3 中 结论 可 写成 


14.5 


Уу? - а; уху 


s$ = 
Y. X N 
М SF 由 X=xz+X,Y=y+y, 利 用 习题 14.3 中 结论 ,有 
№5, у= Ў) Y-a Y-a, X XY 
=X (у + У)? -aX (y+Y)- ad (zr + Х)(у+ Ү) 
= У) (y? +2yY + У?) -al XY + NY) 
-a > (ху + Ху + хү + ХҮ) 
= X y? +2Y OY + №? -ooN7Y -a$ зу ~ а1ХУ)\у 
-aY Y z-a МҮ 
= X y? + NY? ~ aoNY ~ a У\ zy - а; МХ Y 
= $) y? -aX zy + NYÝ(Y - ag - а} Х) 
=$ y-a У)\ zy 
其 中 我 们 用 到 结论 Элл = 0, 2)y = 0, 及 了 = ao+ aiX( 由 正规 方程 3\Y = aoN +a, У\Х Ф 
同 除 以 N 而 得 ) . 
对 习题 14.1 中 的 数据 计算 标准 误差 sy xy .分别 用 (a) 定义 , (b) 习题 14 4 的 结论 ， 
E ES (a) 从 习题 14.4(b) 知 , Y 关于 X 的 回归 直线 为 Y=35.82+0.476X. 表 14.5 给 出 了 Y 的 


真实 值 和 估计 值 ( 记 为 Y。) ,该 估计 值 由 回归 直线 得 到 .例如 , 对 应 Х = 65, 有 Үы=35.82+0.476 х 
65= 66.76. 表 14.5 同时 列 出 了 Y- Ye 的 值 ,以 便 计算 sy у. 


Y 一 Y 2 2 aa. 2 
&у= D Y L LAOIS AAO 60 
ÈX sy у= v 1.643 =1.28 英寸 . 
(b) 从 习题 14.1,14.2 和 14.4 有 
2 _ дуу - а У] зу _ 38.92 - 0.476 х 40.341 (13 
YX NN р ш |], 


ВК sy у= J 1.643 =1.28 英寸 . 





14.6 


(а) 构造 两 条 与 习题 14.1 中 回归 直线 平行 , 且 距 离 为 sy унав, 
(b) 确定 位 于 两 直线 内 的 数据 的 百分数 . 


解 F (а) 习题 14.1 中 所 得 的 回归 直线 为 Y =35.82+0.476Х, ХЕ 14-3 中 用 粗 线 表示 ,两 条 
与 之 平行 县 距离 为 sy x =1.28 的 直线 (见习 题 14.5) ХЕ 14-3 中 用 虚线 表示 、 
(b) 从 图 14-3 可 看 出 , 12 个 点 中 有 7 个 点 位 于 两 直线 之 间 ,3 个 点 好 像 在 两 直线 上 , 经 进一步 检验 ， 
可 知 这 3 个 点 中 有 2 个 位 于 两 直线 之 间 , 故 所 求 百分数 为 9/12 = 75% 
DR MR 14.5 最 后 一 行 可知 , 有 9 个 点 (XX， Y) 所 对 应 的 Y- Ye 的 值 处 于 -1.28 与 1.28( 即 
+ sy.x) 之 闻 , 故 所 求 的 百分数 为 9/12=75% . 

奉 这 些 点 关于 回归 直线 是 正 态 分 布 的 , 则 理论 上 将 应 有 68% 的 点 处 于 两 直线 之 间 , 这 一 结论 对 
大 样本 更 适合 . 

注 :对 习题 14.1 中 身高 的 估计 的 标准 误差 的 最 佳 估 计 可 由 

sy x = VN/(N -2). sy x = v 12/10 .1.28 = 1.40 英寸 





Ki 14-3 


回归 平方 和 与 残 差 平方 和 


14.7 证明; У(Ү-Ү)? =X (Y- Ya) + > (Ya YY 
证 明 б 对 Y-Y=(Y- Ye。)+(Ye。-Y) 两 边 平方 再 求 和 , 则 得 
У\(Ү- У) = OY- Ya) + X (Yue 一 Yi2+2>(Y- Ya) Ya- Y) 
若 能 证 明 上 式 最 后 一 项 为 0, 则 可 得 证 结果 .因为 
DY- Yao)(Ye- Ү) = 2 (YY-a0-aX)(ao talX ~ Ү) 
=ao УМУ -a ~ aX)+t+alD X(Y - а-а Х) 
- ҮУ\(Ү-а- аХ) 
而 由 正规 方程 知 
>)( 了 Y-ao-alX) = 0, У>,Х(Ү-а,-а{Х) = 0 
因而 得 证 . 
用 最 小 二 乘 曲 线 Ye。,= ao+aiX+aX2+…+wX" ,可 证 以 上 结论 对 非 线性 回归 同样 成 立 . 
14.8 对 习题 14.1 中 数据 , 计算 (a) 总 变 差 , (b) 残 差 平方 和 , (с) 回归 平方 和 . 
Ш F 最 小 二 乘 回 归 直 线 为 Ye = 35.8+0.476X. 从 表 14.6 可 以 看 出 ,总 变 差 为 S\(Y - 了) = 
38.917, RÆ FHA J (Y - Yæ) = 19.703, 辐 归 平方 和 为 >)(Y。 - Y)? = 19.214. 


14.6 


















1. 





46562 






66 0.02669 3. 
68 0.06650 0.02532 
65 1.72395 1.61292 
69 0.61074 0.40387 
66 0.40930 4.94068 
68 1.37185 2.52257 
65 5.13361 0.10065 
71 7.73672 0.40387 
67 0.55075 0.02532 
0.48286 1.23628 

5.8419 0.12416 4. 





Ж =38.917 | 和 =19.703 


# = 19.214 


下 面 的 Minitab 输出 得 到 的 结果 与 上 同 , 用 黑体 字 表 示 . 注 意 , 用 软件 使 计算 其 减 少 了 许多 . 


MTB> Regress ‘Y’ 1 ‘X’ 
ОВС > Constant; 

SUBC > Brief 1. 
Regression Analysis 

The regression equation is 
Y=35.8 +0.476X 
Analysis of Variance 


Source DF SS MS F P 
Regression 1 19.214 19.214 9.75 0.011 
Residual Error 10 19.703 1.970 
Total 1i 38.917 

相关 系数 


14.9 用 习题 14.8 中 结论 , 求 (a) 判定 系数 , (Ь) 相关 系数 . 


2 回归 平方 和 19.214 _ 
解 EF (a) 判定 系数 = 一 总 变 差 = 28.917 0:4937 


(b) ЖА = н = + / 0.4937 = + 0.7027 
因为 X 与 Y 是 直接 相关 的 ,所 以 选 正 号 , 且 保 留 两 个 小 数位 ,得 = 0.70. 
14.10 证 明 对 线性 回归 而 言 , 变量 Х 与 Y 间 的 相关 系数 可 写成 


2, ху 
Zel У) у) 
其 中 т=Х-Х,у=Ү-Ү. 


解 EF Y 关于 X 的 最 小 二 乘 回 归 直 线 可 写成 Y est = ag t а; Х 或 Уы 8125, 其 中 














а - 5 Vet 一 Ya Y 
则 
o mapa DOn- у 
总 变 差 DY-Y)Y Dyp 
Bae ауе LoD (уы 
>) у? yy Drel Dy (Pel УУ?) 
H 
r= дулу 
5022) (Уу) 
因为 当 у „ВЕ г 的 增加 而 增加 时 ， пуя 是 正 的 , 而 当 ya 随 х 的 增加 而 减少 时 ， 
x y 
У\ ху х 
БУРУ РУТА 的 相关 关系 自动 取 号 . 因此 我 们 
定义 线性 相关 系数 为 


my ___ 
V( > z?) (У) 


r 


这 通常 称 为 线性 相关 系数 的 积 -和 矩 公式 . 
线性 相关 系数 的 积 -和 抢 公 式 
14.11 RE 14.7 中 变量 X 和 Y 的 线性 相关 系数 . 





解 E 计算 的 结果 见 表 14.8. 则 


_ дјзу ____в4_ 
М >ух°}( Dy) 132x56 


正如 我 们 在 习题 13.8 和 13.12 中 观察 到 的 一 样 , r 的 值 表 明 X 与 了 间 存 在 很 高 的 相关 性 . 


= 0.977 











Sry = 84 | Xy? = 56 


14.12 对 习题 14.11 中 的 数据 , 求 (a) X 的 标准 差 ,(b) Y 的 标准 差 , (с) X 的 方差 ,(d) Y 的 
TÆ, (е) X 5 Y 的 协 方 差 .并 把 这 些 值 与 Minitab 结果 进行 比较 , 解释 其 中 存在 的 差 
F. 


(X- XF z? 
解 EF (a) X 的 标准 差 为 ;x = >e. /| [124 = 4.06 


A” 一 一 
(Y- Үү)? 2 
o уйшен = [2007 ar, 125 = 2.65 


(с) X 的 方差 为 ;和 = 16.50 
(4) Y 的 方差 为 = 7.00 


Minitab 输出 如 下 : 
МТВ > Standard deviation c1 
Column Standard deviation 
Standard deviation of X = 4.3425 
MTB > Standard deviation c2 
Column Standard deviation 
Standard deviation of Y = 2.8284 
MTB > covariance cl c2 


Covariance 


X 18.85714 
Y 12.00000 8.00000 


值 之 间 的 差别 , 主要 是 在 Minitab 中 除 以 N-1 而 非 М. 
14.13 ”对 习题 14.11 中 的 数据 , 验证 公式 „=. 
Ү 
# б 由 习题 14.12 可 知 


5хү 10.50 

sysy 4.06 x 2.65 
RT EARE, 所 得 结果 与 习题 14.11 中 的 结论 一 致 . 

14.14 “用 积 - 矩 公式 , 求 习 题 14.1 中 数据 的 线性 相关 系数 . 


М F 由 表 14.3 可 知 


= 0.976 


r = 


> azy 40.34 


与 习题 14.9 中 所 得 结论 一 致 . 
14.15 证 明 线性 相关 系数 为 


и NO XY - (УХ) DY) 
үм x Ex lE r- (BY)’] 
证 明 F 令 z=X-X,y= 了 - 立 , 由 习题 14.10 中 的 结论 ,有 
> ху У(Х - Х)(Ү- Y) 


а) У) т Д Ух х2]. | УК Үсү] (34) 


因为 X= ( У) х)ум, у = (У ү) у/м, 所 以 
DX- ХҮ - Ү) = (XY- ХТ - XY + ХӮ) 
= ууХхү-ХУҮ-ҮУХ+ МҮ 


= У) XY - NXY - NYX + МХ Ү 


= X XY + NXY 
vy Nr] 
一 N 
同 理 
X (X -XY = Уу (х? -2XX +X) = У)х?-2ХУ)Хх + М? 
2 2 
-yx 20220 „2x 
Уух), 
уе >X 
E 
2 
>’ (Y- Ү)? = Zr- Ar) 
则 (34) 可 写成 


OND 
(5 Ex) ум]. [FY СУУ] 
— Nyx- (DY) __ 


14.16 用 习题 14.15 中 公式 求 习 题 14.1 中 数据 的 线性 相关 系数 、 


H EF 


NO OD) 
VIA TAN TIN (vy 


V 


_ 12 x 54107 — 800 х 811 _ 0.7027 
= 
vV (12 х 53418 – 8002) (12 х 54849 — 8112) 


结论 与 习题 14.9 A 14.14 的 一 致 
ЭКЕ > 的 值 和 X,Y 的 初始 值 无 关 . 因 此 我 们 先进 行 数 据 变 换 ;X' =X -60, Y = Y -60 然后 按 
习题 14.15 中 公式 计算 ,得 
[NB x (Bx) J [NS TY 
_ 12 x 647 – 80 х 91 
/ (12 x 618 - 802) (12 х 729 — 912) 


分 组 数据 的 相关 系数 


14.17 表 14.9 给 出 了 100 名 学 生 的 数学 、 物 理 成 绩 的 频数 分 布 . 通过 此 表 计 算 ， 
(а) 数学 成 绩 在 70—79 之 间 且 物理 成 绩 在 80 一 89 之 间 的 学 生 人 数 . 
(b) 数学 成 绩 低 于 70 分 的 学 生 百 分 比 . 
(с) 物理 成 绩 在 70 分 以 上 而 数学 成 绩 在 80 分 以 下 的 学 生 人 数 . 
(d) 假定 及 格 线 为 60 分 , 则 求 至 少 有 一 门 课 及 格 的 学 生 的 百分比 . 
解 ES (a) 由 表 14.9, 可 得 所 求学 生 人 数 为 4. 
(b) 数学 成 绩 低 于 70 分 的 学 生 人 数 = (40 一 49 分 的 人 数 ) + (50—59 分 的 人 数 ) + (60—69 分 的 人 
#0) =7+15+25 = 47. ЛН 47/100 = 47%. 
(с) 由 表 14.10 可 知 ,该 部 分 学 生 人 数 =1+5+2+4+10=22. 
(9) 由 表 14.11 可 知 ,两 门 课 都 不 及 格 的 学 生 人 数 为 3+3+ 6+5=17. 故 至 少 一 门 及 格 的 学 生 人 数 
为 100-17=83, 由 此 可 知 百分比 为 :83/100= 83%. 
表 14.9 有 时 称 为 二 元 频数 表 , 或 二 元 频数 分 布 . 表 中 的 每 一 方 格 称 为 一 个 单元 ， 相应 于 一 对 分 
组 区 间 .单元 中 的 数值 称 为 单元 频数 .例如 , (a) 中 数 4 即 为 对 应 于 数学 分 为 70—79, 物理 分 为 80 一 


= 0.7027 


89 的 分 组 区 间 上 的 单元 频数 . 
K 14.9 最 后 一 行 和 最 后 一 列 的 值 称 为 边际 和 ,或 边际 频数 . 它们 分 别 对 应 于 数学 成 绩 和 物理 
成 绩 的 各 自 的 频数 分 布 . 
表 14.9 
数学 成 绩 


Г р у To 
nnn) | fs ы а Гы 
а [өе | 5 а 
EE НЕТИ 
"өӊ о | [у Е 






















50—59 
40—49 











14.18 ”对 二 元 频数 表 中 的 分 组 数据 ( 表 14.9), 如 何 修正 习题 14.15 中 的 公式 . 


E тє 对 分 组 数据 , 我 们 可 以 把 变量 X 与 Y 的 不 同 信 作 为 分 类 数值 , 而 уу 与 у 为 相应 的 分 类 
频数 , 记 在 二 元 频数 表 的 最 后 一 行 和 最 后 一 列 . 若 设 у 为 相应 分 类 数值 对 (X,Y) 的 不 同 单元 的 单 
元 频数 , 则 我 们 可 以 把 习题 14.15 中 的 公式 变 为 
мужу МА) (Улу) ез5) 
у} Мм Уух? - (5) х): СУ др (У) ду) 
若 设 X= А + сушу, Y= В + сушу, Ё су 和 cy ЗИН (БЫ Ж ), A 和 B 为 对 
应 变量 的 任意 分 类 成 绩 ,公式 (35) 即 变 为 本 章 的 公式 (21)， 
E N S) fuxuy ( Ў) frux) ( У fyuy) оз) 
VUNE fuk- (О нх) JINE fug - (Уау) ] 


这 是 在 前 面 章节 中 为 计算 均值 ,标准 差 和 高 阶 矩 而 采用 的 编码 方法 . 


14.19 求 习 题 14.17 中 数学 和 物理 成 绩 的 线性 相关 系数 . 


E F 利用 公式 (21), 相关 的 计算 结果 见 表 14. 12, 称 为 相关 表 . У) у, Y frux, У Hui， 
X fy D fyuy, > fuy 通过 编码 方法 计算 . 
а 
成绩 | 学 成 绩 


мышы 


_| e ЕЛЕСИ 


fe 23 a УА= У |У frur |У) fru, |5 furuy 


Cm I 

л 

м 
НЩ 

后 
el [е] fe 
— 

з 

і 

ыы 

小 

с^ 

оо 

м 

с» 


= 100 = —55 | = 253 = 125 


每 列 的 у) furuy 
角 数 和 = 125 


表 14.12 中 每 一 单元 的 右 下 角 处 的 数 表示 乘积 fuyxuy, 其 中 了 是 单元 频数 .每 一 行 的 角 边 数 之 和 
列 在 同一 行 的 最 后 一 列 ; 而 每 一 列 的 角 边 数 之 和 列 在 同一 列 的 最 后 一 行 .最 后 一 行 与 最 后 一 列 的 和 
相等 ,表示 >) fuxuy 的 值 . 
从 表 14.12, 有 
[NA - ( У) fxux) ? 1. LN У) а, 一 | S) fyuy) ] 


_ 100 x 125 – 64 x (- 55) ____16020___ - 0.7686 
V (100 х 236 – 642)(100 х 253 ~ (— 55)?) У 19504 х 22275 


14.20 ЖЖ 14.12 来 计算 (a)sx, (b) sy, (с) зуу, 由 此 验证 公式 к= syy/ (sy sy). 


# EF 


人 _ У) fxux ? = 


1236 _ ы > _ 
N = 10 100 100) = 13.966 








(a) sx = су 














(с) SXY 一 一 Б Sp хы = 
М М 
125 64 — 55 
= 10x10 x | 125- [ $£) (785) | 160.20 
因此 数学 与 物理 成 绩 的 标准 差分 别 为 14.0 和 14.9, 而 它们 的 协 方差 为 160 2 因此 相关 系数 为 
5ху 160.2 


= ssy 13.966 x 14.925 ~ 0.7686 


与 习题 14.19 的 结论 一 致 ， 

回归 直线 和 相关 系数 

14.21 证 明 Y 关 于 X 的 回归 直线 方程 与 X 关于 YY 的 回归 直线 方程 分 别 为 ， 
(a) Y-Y= (X-X), X-X- (Y-F). 


证 明 EF (а) 从 习题 13.15(a) 可 知 , Y $F X 的 回归 直线 方程 为 














y = но. z 或 с: 

又 由 习题 14.10 结论 ,有 
r= 2 zy 
(Del У) 

因此 

Xo 41У) (Уу) _ т у Мә? ry 

Уу? > ух? | У)х? Оозу 
即 得 所 需 结论 ， 


(b) 交换 (a) 中 X 和 Y 的 位 置 即 得 所 需 结论 . 
14.22 在 工 关于 X 的 回归 直线 和 X 关 于 YY 的 回归 直线 分 别 由 Ү=а,+а,Х,Х =b, +b Y 
给 出 ， 证 明 ауф Бу = ?. 


证 明 EF 由 习题 14.21 的 结论 可 知 


因此 


14.23 


14.24 


14.25 


14.26 


абу = 
这 个 结论 可 以 作为 线性 相关 系数 定义 的 出 发 点 ， 
用 习题 14.22 的 结论 求 习 题 14.1 中 数据 的 线性 相关 系数 . 
М S 由 习题 14.1 可 知 :ai =484/1016 =0.476, b; = 484/467 = 1.036, 因此 r?= a,b = (484/ 


1016) х (484/467), 得 r=0.7027. 这 和 习题 14.9,14.14 和 14.16 中 得 到 的 结论 一 致 . 
对 习题 14.19 中 的 数据 , БН (а) Y 关于 X 的 回归 直线 方程 , (b) X 关于 Y 的 回归 直 





线 方程 . 
Ж ТЕ 由 习题 14.19 的 相关 表 ( 表 14.12) 得 
Х=А+ frux “ы „‚10х64_ м 
一 Cy N = . 100 = . 
Ү=В+ Ufy “уох 二 35) - 69.0 
“Y N С! 100 | 


由 习题 14.20 的 结论 ,有 sx = 13.966, зу = 14.925 #1 = 0.7686. 现 用 习题 14.21(a) 与 (b) 的 结论 得 
到 相应 的 回归 方程 . 
(8Ү-Ү=—(Х - X), 

5х 


0.7686 х 14.925 


Y -69.0= = 3 066 


(X —70.9)=0.821(Х - 70.9) 

(ух -Х= (у-ү), 

0 7686 х 13.966 
14.925 

对 习题 14.19 的 数据 ,用 习题 14.20 的 结论 , RERE (а) 5, y, (b) sx ү. 

Ж EE (а) sy x=sy V1- r=14.925x V1-0.7686: =9.548 

(b) зу у= sx /1-2=13.966х V1-0.7686: = 8.934 

表 14.13 给 出 了 美国 在 1990 年 到 1996 年 消费 者 在 食品 和 医疗 保健 方面 的 价格 指数 


(基于 1982—1984 年 的 价格 ,均值 为 100) .计算 这 两 类 指数 的 相关 系数 , 并 给 出 这 个 
系数 的 Minitab 解 . 
表 14.13 


来 源 :美国 劳工 统计 局 . 


X – 70.9 = (У - 69.0) =0.719(Ү – 69.0) 













E F 食品 和 医疗 保健 消费 指数 分 别 记 为 X 和 Y, 一 些 相关 计算 见 表 14.14. 





342.222 










122.227 471.32 
137.9 34.698 74.13 
140.9 — 2.771 7.24 
144.3 29.127 151.04 
140.981 474.80 






335.301 


然后 利用 积 - 矩 公 式 可 得 


/TJ /I 


把 x 值 输入 到 cl 列 .Y 的 值 输入 到 c2 列 , 利用 命令 correlation cl c2 即 可 得 到 相关 系数 . 
MTB > correlation cl c2 

Correlations (Pearson) 

Correlation of X and Y =0.975 


非 线 性 相关 
14.27 ХЇЖ 14.15 中 数据 拟 合 一 条 形 如 Y=a6+a, 久 +a,X? 的 最 小 二 乘 抛 物 线 . 


表 14.15 



















1.8 
5.9 


3.1 
7.0 


4.9 
7.8 


5.7 
7.2 


7.1 8.6 
6.8 4.5 














解 rF 第 十 三 章 中 正规 方程 (23) 为 


DY Y=aN+a У\Х + а; > X? 
OXY = a DX+tad)X + а, x (36) 
У\х?ү = а, УХ? + ау УУХ? + a2 >, X‘ 
和 的 计算 列 在 表 14.16 中 , 因 N = 8, (36) 式 即 为 
8а, + 42.2а, + 291.20а, = 46.4 
42.2a0 + 291.20а, + 2275.35а› = 230.42 (37) 
291.20а6 + 2275.35а; + 18971.92а, = 1449.00 
解 得 а= 2.588, а; =2.065,а, = — 0.2110. 因此 所 求 最 小 二 乘 回 归 抛 物 线 方程 为 
Y = 2.588 + 2.065Х ~ 0.2110X? 


1055.58 
2541.16 
5470.12 
9223.66 


2 . 5 
8 .9 
1 „0 
9 -8 
7 .2 
1 .8 
6 ‚5 
8 ‚7 





14.28 ”利用 习题 14.27 中 的 最 小 二 乘 抛物 线 来 估计 对 应 于 给 定义 的 了 值 


Ж F 对 X=1.2, Y=2.588+2.065x1.2 -0.2110x1.2=4.762. 其 他 值 也 可 类 似 求 出 . 结 
果 见 表 14.17, 它 也 给 出 了 Y 的 实际 值 . 


表 14.17 









6.962 7.640 7.503 6.613 4.741 2.561 





14.29 (а) 求 习题 14.27 PEE X 5 Ү 之 则 的 线性 相关 系数 . 
(b) 假设 习题 14.27 中 抛物 线 关系 已 知 , 求 变量 间 的 非 线 性 相关 系数 ， 
(с) 解释 (a) , (b) 所 得 相关 系数 间 的 差异 . 
(d) Ве х Уу 间 存 在 抛物 线 关系 . 求 残 差 平 方 和 与 总 变 差 的 百分比 . 


解 F (а) 用 表 14.16 中 已 有 的 计算 值 及 У\ ү? = 290.52, 可 得 
_ NO XY- (2x)( SY) 
уму х2 ~ (1х) innr- Sr] 
_ 8 х 230.42 – 42.2 x 46.4 L L 0.3743 
У (8 x 291.20 — 42.22) (8 x 290.52 - 46.42) 
(b) 由 表 14.16 可 知 了 = ( X Y)/N = 46.4/8 = 5.80; 因 此 总 变 差 为 31(Y - Y)? = 21.40. HX 
14.17 知 回归 平方 和 为 > Ya- Y)? = 21.02, 因此 


2 ”回归 平方 和 21.02 
r= Aag T 21.40 ~ 0.9822, 


Вр 

ғ = 0.9911 或 ‚= 0.99 
(с) 由 (a) 中 给 出 的 线性 相关 系数 — 0.3743, 仅 能 表明 XX 与 Y 之 间 实 际 上 没有 线性 关系 . 然而 由 (b) 
中 所 得 相关 系数 0.99 可 知 ,X 与 Y 之 间 存 在 非常 好 的 非 线 性 关系 , 即 抛物 线 关系 . 


(d) Г 1,2-1- 0.9822= 0.0178 
因此 残 差 平方 和 占 总 变 差 的 1.78% , 这 是 由 于 某 种 随机 波动 或 某 种 未 考虑 到 的 原因 所 引起 的 ， 


14.30 对 习题 14.27 中 的 数据 , 写 出 (a) sy, (b)sy у. 
E 037 (а) 从 习题 14.29(b) 可 知 У\(Ү- Y)? = 21.40 , 故 


| Sr- ү) 
sy = OD |2140 = 1.636 或 ”1.64 


(b) 解法 一 ”利用 (a) 的 结果 以 及 习题 14.29(b) 的 结论 , 可 得 Y 关于 XX 的 估计 的 标准 误差 


sy.x = sy V1- 2 = 1.636 - V1- 0.99112 = 0.218 或 0.22 
解法 二 ”由 习题 14.29, 有 


(Ү- Кы)? Z 
у=} LY- Yo) - [PEETA 
= | = 0.218 或 0.22 


解法 三 由 习题 14.27 结论 及 У\ ү? = 290.52 有 


ү? – ү -~ ХҮ - X? Y 
ых /之 а 2 m 293 = 0.218 或 0.22 





相关 的 抽样 理论 
14.31 容量 为 18 的 样本 的 相关 系数 为 0.32. 在 显著 性 水 平 (a) 0.05, (b) 0.01 F, Жж 
定 总 体 相关 系数 不 为 0? 


解 EF 我 们 将 在 假设 Ho:0=0 Ж Hi:o>0 之 间 进 行 选择 . 
r- r УМ ~ 2 _ 0.32. у18-2 _ 1.35 
Ji- J1 -0.32 | 

(а) 在 水 平 0.05 F,H : 分 布 的 单 边 检 验 , Ж t >to 5018-2) = 1.75, WHE Ho. 因 为 1.35< 
1.75, REKE 0.05 下 不 能 拒绝 н, 
(b) Ж EKF 0.05 下 都 不 能 拒绝 H, 在 水 平 0.01 下 就 更 不 能 拒绝 Ho. 

14.32 在 显著 性 水 平 0.05 F, 样本 容量 至 少 为 多 大 ,才能 认为 相关 系数 0.32 与 0 显著 不 
同 ? 


14.33 


14.34 


14.35 


R ES EKF 0.05 下 用 1 分布 的 单 边 检验 , 则 N 的 最 小 值 必须 满足 

0.32. /N-2 

Jio 352 = 10.95 

目 由 度 为 N 一 2. 当 自由 度 无 限 大 时 , г, os = 1.64, 因此 N=25.6. 
对 N=26: v=24, 100=1.71, £=0.32 V24/ / 1—0. 322=1.65 
对 N=27: v=25, toọos=1.71, =0.32/25/ /1—0.322=1.69 
对 N=28: v=26, i005=1.71, г=0.32 V26/ V1-0.32=1.72 
因此 最 小 的 样本 容量 应 为 N = 28. 
容量 为 24 的 样本 的 相关 系数 为 0.75. 在 显著 性 水 平 0.05 F, 是 否 能 拒绝 总 体 相关 系 
数 为 (a) о=0.60,(Ь) о=0.50 的 假设 ? 














解 Е (a) 
Z= 1.1513log| т: 0.15) = 0.9730, и, = 1.1513log 1 +0.60) = 0.6932 
H 
o = і = —1— — 0.2182 
JN-3 J/h 
因此 


Z- pz _ 0.9730 - 0.6932 
oy 0.2182 


在 显著 性 水 平 0.05 下 用 正 态 分 布 的 单 边 检验 , 仅 当 = > 1.64 时 拒绝 假设 因为 ><1.64, 我们 不 能 
拒绝 总 体 相关 系数 为 0.60 的 假设 . 

(b) 着 p=0.50, 则 jyz=1.1513log3=0.5493 以 及 z= (0.9730 一 0.5493)/0.2182=1.94. 因 为 z> 
1.64, 故 在 水 平 0.05 F, 可 以 拒绝 总 体 相关 系数 为 0.50 的 假设 . 

21 名 学 生 的 数学 与 物理 成 绩 间 的 相关 系数 为 0.80. 求 该 系数 的 95% 的 置信 限 . 


E ES 因为 r=0.80,N =21, 故 uz 的 95% 的 置信 限 为 


= 1.28 


= 二 


1+ 
l-r 








Z + 1.96, = 1.1513log| | +1.96. 


1 — 
3 = 1.0986 + 0.4620 
因此 jz 的 95% 的 置信 区 间 为 (0.5366, 1.5606). 若 


uz = 1.15131ов| к = 0.5366, р = 0.4904 
若 
pz = 1.1513log| 12) = 1.5606, р = 0.9155 
故 р 的 95% 的 置信 限 为 0.49 ЯП 0.92. 
从 容量 为 Ni = 28 和 №, = 35 的 两 个 样本 中 分 别 得 出 相应 的 相关 系数 r1=0.50,r, = 
0.30. 在 显著 性 水 平 0.05 下 判断 两 相关 系数 之 间 是 否 存 在 显著 差异 ? 
E EF 


1 + 
1— 








1 + 
1 一 


_ 1 —i _ 
02-2, = N з + p, 3 = 0.2669 


我 们 将 在 假设 Ho H “7, 一 Hz, 和 Н, AZ 天 pz Z 间 进 行 选择 . 在 假设 Н 下 


Z; = 1.1513log 可 = 0.5493, Z, = 1.1513log = 0.3095 
2 





7 - fı- 22- (pz на) - 0.5493 — 0.3095-0_ gogs 
021-2, 0.2669 7 


在 水 平 0.05 下 用 正 态 分 布 的 双边 检验 , $ Z>1.96 或 Z< 一 1.96, 则 拒绝 Ho. 故我 们 不 能 拒绝 
Ho, 即 认为 在 水 平 0.05 F, 两 总 体 的 相关 系数 之 间 没 有 显著 差异 . 


回归 的 抽样 理论 
14.36 在 习题 14.1 中 得 知 Y 关于 X 的 回归 方程 为 Y=35$.82+0.476X .在 显著 性 水 平 0.05 


14.37 


下 ,检验 零 假设 :总 体 回 归 方 程 的 回归 系数 为 0.180, 其 备 择 假设 为 ， 站 条 系数 大 于 
0.180. 用 手 算 方 法 进行 检验 , 再 用 Minitab 软件 进行 检验 . 


M EE 


i 

这 是 因为 Sy x=1.28( 见 习题 14.5), Sx= /( Уу x?)/N = V84.68/12 = 2.66. 在 显著 性 水 平 
0.05 F,H : 分 布 的 单 边 检验 , 若 上 >to(12-2)=1.81, 则 拒绝 回归 系数 为 0.180 的 假设 .因此 时 
上 =1.95>1.81, 故 拒绝 零 假设 . 

此 题 的 Minitab 输出 如 下 ， 
МТВ > Regress ‘Y?’ 1 *Х'; 
SUBC> Constant; 
SUBC > Predict c7. 
Regression Analysis 
The regreddion equation is 
Y= 35.8 +0.476 X 


Predictor Coef StDev T P 
Constant 35.82 10.18 3.52 0.006 
X 0.4764 0.1525 3.12 0.011 


S = 1.404 R- Sq= 49.4% R- Sq(adj) = 44.3% 
Analysis of Variance 


Source DF SS MS 上 P 
Regression 1 19.214 19.214 9.75 0.011 
Residual Error 10 19.703 1.970 
Total 11 38.917 
Predicted Values 
Fit StDev Fit 95.0% CI 95.0% PI 
66.789 0.478 (65.724, 67.855) (63.485, 70.094) 
69.171 0.650 (67.723, 70.620) (65.724, 72.618) 
如 下 的 部 分 给 出 假设 检验 所 需 的 信息 ， 
Predictor Coef StDev T P 
Constant 35.82 10.18 3.52 0.006 
X 0.4764 0.1525 3.12 0.011 
检验 统计 量 的 值 如 下 : 


_ 0.4764 - 0.180 
70.1525 


输出 的 г 值 为 3.12, 用 来 检验 回归 系数 为 0.180 的 零 假设 . 为 了 检验 回归 系数 的 任何 其 他 值 , 需要 
进行 上 述 类 似 的 计算 .例如 , 若 对 回归 系数 为 0.25 的 假设 进行 检验 ， 则 计算 的 上 值 等 于 


‚ = 0-4764-0.25_, ag 


0.1525 
回归 系数 为 0.25 的 零 假 设 将 不 会 被 拒绝 . 
对 习题 14.36 的 回归 系数 求 95% 的 置信 限 . 用 手 算 方 法 进行 计算 , 再 用 Minitab 软件 
进行 检验 . 
М F 置信 区 间 可 表示 为 


= 1.94 





因此 А, 的 95% 图 信 和 限 ( 通 过 设 1= 土 10 oys(12 一 2)= +2.23 得 到 ) 为 





2.23 Sya 2.23 1.28 _ 
+ 6:43, = 0.476 + . = 0.476 + 0.340 
а 一 по 3 Sy v10 .66 


即 А, 95% 8181 [8] 37(0.136, 0.816). 
以 下 的 Minitab 输出 从 习题 14.36 得 到 , 它 给 出 了 计算 95% 置信 区 间 所 需 的 信息 . 








Predictor Сое} StDev 工 Р 
Constant 35.82 10.18 3.52 0.006 
X 0.4764 0.1525 3.12 0.011 
有 时 称 
1 | Sy x 
VN-2 Sx 


为 对 应 于 回归 系数 的 估计 的 标准 误差 .输出 中 标准 误差 的 值 为 0.1525. 为 了 计算 95% 置信 区 间 , 用 
10.975 乘 以 此 标准 误差 , 然后 再 从 а, = 0.476 中 加 上 或 减 去 此 项 ,从 而 得 到 А, 的 置信 区 间 如 下 
0.476 + 2.23 x 0.1525 = 0.476 + 0.340 
14.38 在 习题 14.1 中 , 若 父 亲身 高 分 别 为 (a) 65.0 英寸 ,(b) 70.0 英寸 , 试 写 出 儿子 身高 的 
95% 置信 限 . 用 手 算 方法 进行 计算 , 再 用 Minitab 软件 进行 计算 
解 ES 因为 10 0s(12 一 2) =2.23, 则 yp 的 95% 置信 限 为 


2.23 | (Х,- Х)? 
Ya t -一 一 一 N + 1 + 一 一 一 
"VN-2 YXYy 5% 


其 中 Ү,=35.82+0.476Х,, Sy х=1.28, Sy =2.66, №= 12. 
(а) Æ Х„= 65.0, W Ү,= 66.76 英寸 .(Xo- X)? = (65.0 - 66.67)? = 2.78.[ 95% SAZIR X 





2.23 2.78 
.76 + 1.28. [12+ 1+ = 66.76 + 3.30 英 、 
66 76+ е 1.28 2 > 662 英寸 


即 我 们 能 以 95% 的 概率 保证 儿子 身高 落 在 (63.46, 70.06). 
(b) Æ Xo=70.0, 则 Yo=69.14 ŽF. (Xo - X)? = (70.0 - 66.67)2=11.09. 因 此 95% 置信 限 为 
69.14 +3.45 炎 才 . 即 我 们 能 以 95% 的 概率 保证 儿子 身高 落 在 (65.69,72 .59) 内 -4 
以 下 的 Minitab 输出 从 习题 14.36 得 到 , 它 给 出 了 计算 95% 置信 区 间 所 需 的 信息 . 
Predicted Values 


Fit StDev Fit 95.0% CI 95.0% PI 
66.789 0.478 (65.724,67.855) (63.485, 70.094) 
69.171 0.650 (67.723, 70.620) (65.724, 72.618) 


单个 观测 值 的 置信 区 间 有 时 也 认为 是 预测 区 间 .95% 的 预测 区 间 用 黑体 字 表 示 . 不 考虑 舍 入 误 关 
这 些 区 间 与 上 面 计算 结果 一 致 . 

14.39 在 习题 14.1 中 ,车 父亲 身高 分 别 为 (a) 65.0 英寸 , (b) 70.0 英寸 , 试 写 出 儿子 平均 身 
高 的 95% 置信 限 . 用 手 算 方 法 进行 计算 , 再 用 Minitab 软件 进行 计算 . 


解 EF 因为 toss(12-2)=2.23, 则 了 的 95% 置信 限 为 


2.23 (Xo 一 XY 
Yy SES, y [1+ -一 0 一 一 一 


其 中 Ү,=35.82+0.476Х6,5у у= 1.28, Sy =2.66. 
(а) Æ Xo= 65.0, 则 其 置信 限 为 66.76 土 1.07 或 65.7 和 67.8. 
(b) Ж Xo= 70.0, 则 其 置信 限 为 69.14+1.45 #Ё 67.7 #1 70.6. 
以 下 的 Minitab 输出 从 习题 14.36 得 到 , 它 给 出 了 平均 身高 的 95% 置信 区 间 , 用 黑体 字 表 示 . 
Predicted Values 
Еп StDev Fit 95.0% CI 95.0% PI 


66.789 0.478 (65.724, 67.855) (63.485, 70.094) 
69.171 0.650 (67.723, 70.620) (65.724, 72.618) 


kh Æ Ж 
线性 回归 和 相关 


14.40 表 14.18 给 出 了 10 个 学 生 在 生物 学 方面 的 两 次 测试 的 成 绩 (分 别 记 为 XAY). 
(а) 构造 散 点 图 ; 
(b) 求 了 关于 X 的 最 小 二 乘 回 归 直 线 ; 
OCR X 关于 立 的 最 小 二 乘 回归 直线; 
(а) 在 (a) 中 散 点 图 上 画 出 (b)、(c) 中 的 直线 . 
14.41 ”对 表 14.18 中 的 数据 , 求 (a) sy у, (b)sy y. 


表 14.18 





第 -次 测验 成 绩 (XX ) 
第 二 次 测验 成 绩 (Y) 6 8 6 


14.42 ”对 习题 14.40 中 的 数据 ,计算 (a) Y 的 总 变 差 , (b) Y 的 残 差 平 方 和 , (с) Y 的 回归 平方 和 . 
14.43 用 习题 14.42 结论 , 求 习题 14.40 中 两 次 成 绩 间 的 相关 系数 . 
14.44 (а) 用 积 - 窍 公式 求 习 题 14.40 中 两 次 成 绩 间 的 相关 系数 .并 与 习题 14.43 的 结论 比较 . 
(b) 直接 从 习题 14.40 的 (b)、(c) 的 两 回归 直线 的 斜率 求 相关 系数 . 
14.45 (а) Ё, (b) 用 公式 syy = rsxsy 以 及 习题 14.43 或 习题 14.44 的 结论 , 求 习 题 14.40 中 数据 的 协 方 
25. 
14.46 R14.19 ET 12 名 妇女 的 年 龄 X 和 血压 Y 的 数据 . 
(а) Ж X 与 立 闻 的 相关 系数 . 
(b) 求 了 关于 X 的 最 小 二 乘 回 归 方 程 . 
(с) 行 一 妇女 年 龄 为 45 岁 , 估计 其 血压 ， 


表 14.19 
ЕХ) 56 42 72 36 63 47 55 49 38 4 68 60 
血压 (YY) 147 125 160 118 149 128 150 145 115 140 152 155 


14.47 对 (a) 2781 13.32, (b) 习题 13.35 中 数据 分 别 求 相关 系数 . 

14.48 AZE X 与 Y 的 相关 系数 为 x =0.60. 若 sy =1.50， sy =2.00, Х = 10, Y=20, 求 (a) Y 关于 XX 的 回 
HERH, (b) X 关于 Y 的 回归 直线 方程 . 

14.49 ”对 习题 14.48 中 的 数据 , 求 (a) sy ys (b)sy y. 

14.50 Æ sy w=3,sy=5, 求 7. 

14.51 #Х 与 了 的 相关 系数 为 0.50, 通过 回归 方程 求 残 差 平方 和 占 总 变 差 的 百分比 ， 

14.52 (а) 证 明 Y XFX 的 回归 直线 方程 可 写成 


$ 


Y- Y= 2х - х) 
Sy 
(b) 与 出 和 关于 YY 的 类 似 的 回归 直线 方程 ， 
14.53 (а) RÈ 14.20 中 给 出 的 着 与 了 的 相关 系数 
表 14.20 





(b) 对 表 14.20 中 的 数据 作 变 换 :X =2X+6, Y =3X-— 15. 求 X 与 六 间 的 相关 系数 ,并 解释 无 论 做 


14.54 


14.55 


14.56 


14.57 


不 做 这 样 的 变换 , 所 得 结果 始终 与 (a) 中 结果 相同 这 一 现象 . 
(а) 对 习题 14.53 (а) 、(b) 的 数据 ,分 别 求 Y 关于 X 的 回归 方程 . 
(b) 讨论 回归 方程 间 的 关系 . 
(а) ПЕВ X 与 了 的 相关 系数 可 写成 
‚= ХҮ-ХҮ 
V (X? - Х?)(Ү?- Үү?) 
(b) 用 此 方法 ,求解 习题 14.1. 
证 明 相 关系 数 与 变量 初始 值 及 它们 的 单位 的 选择 均 无 关 .( 提 示 : 假 定 X' =cX+A,Y' =с,Ү +В, 
其 中 c1,cs, A 和 B 都 是 任意 常数 ,证 明 X’ 与 Y' 间 的 相关 系数 等 于 XX 与 Y 间 的 相关 系数 ) 
(а) 证 明 : 对 线性 回归 来 说 








2 2 
YX SX.Y 
sy sx 


始终 成 立 . 
(b), (a) 中 结论 对 非 线 性 回归 也 成 立 吗 ? 


分 组 数据 的 相关 系数 
14.58 表 14.21 给 出 了 300 个 美国 成 年 男子 身高 与 体重 的 频数 表 . 求 身高 与 体重 间 的 相关 系数 


14.59 


14.60 


表 14.21 
身高 X( 英 寸 ) 
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(а) 对 习题 14.58 中 的 数据 , 求 Y 关于 多 的 最 小 二 乘 回归 方程 
(b) 两 男子 身高 分 别 为 64 和 72 英寸 , 估计 他 们 的 体重 . 
对 习题 14.58 中 的 数据 , 求 (a)sy у, (b)sy y. 


14.61 对 分 组 数据 的 相关 系数 ,建立 本 章 的 公式 (21). 
时 间 序 列 相关 


14.62 


Ж 14.22 给 出 了 1988 年 到 1995 年 每 一 一 消费 者 的 年 平均 医疗 保健 支出 和 资产 收入 . 求 二 者 间 的 相关 
系数 . 


表 14. 22 
年 份 1988 1989 1990 1991 1992 1993 1994 1995 
医疗 保健 支出 | 1298 1407 1480 1554 1634 1776 1755 1732 
资产 收入 17076 18194 19220 19715 20660 21288 22104 23233 


来 源 :劳工 统计 局 和 美国 经 济 分 析 局 


14.63 X 14.23 给 出 了 1989 年 到 1998 年 间 每 年 7 月 份 的 平均 气温 和 降雨 量 . 求 二 者 的 相关 系数 ， 


表 14.23 


年 份 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 
温度 (F) 78.1 71.8 75.6 72.7 75.3 73.6 75.1 75.3 73.8 70.4 


降雨 量 ( 英 寸 ) 6.23 3.64 3.42 2.84 1.83 2.82 4.04 2.56 1.18 4.19 


相关 的 抽样 理论 


14.64 容量 为 27 的 样本 的 相关 系数 为 0.40. 在 显著 性 水 平 (a) 0.05, (Ь) 0.01 下 判断 , 相应 总 体 的 相关 系数 
是 否 为 0? 

14.65 容量 为 35 的 样本 的 相关 系数 为 0.40. 在 显著 性 水 平 0.05 下 能 否 拒绝 假设 :(a) 总 体 相关 系数 为 o = 
0.30, (b) 总 体 相 关系 数 为 po=0.70? 

14.66 容量 为 28 的 样本 的 相关 系数 为 0.40. 求 (a) 总 体 相关 系数 的 95% 置信 限 , (b) 总 体 相 关系 数 的 99% 
置信 上限. 

14.67 FERRERA 52, RE 14.66. 

14.68 K(a) 习题 14.46, (b) 习题 14.58 中 相关 系数 的 95% ЕН. 

14.69 容量 为 23 和 28 的 样本 的 相关 系数 分 别 为 0.80 和 0.95. КЕ (а) 0.05, (b) 0.01 F, 能 否 断 
定 两 系数 间 存 在 显著 差异 ? 


回归 的 抽样 理论 


14.70 样本 容量 为 27 的 样本 中 Y 关于 X 的 回归 方程 为 Y= 25.0+ 2.00X. 若 sy ,= 1.50， sy = 3.00, X = 
7.50, 求 回归 系数 的 (a) 95% , (b) 99% 的 置信 限 . 

14.71 对 习题 14.70, 在 显著 性 水 平 0.01 下 ,对 假设 :总 体 回归 系数 为 (a) 1.70 和 (b) 2.20 进行 检验 . 

14.72 ”对 习题 14.70, 当 X=6.00 时 , 求 了 的 (a) 95%, (b) 99% H ЕН. 

14.73 ”对 习题 14.70, 当 X=6.00 时 , 求 Y 的 平均 值 的 (a) 95%, (b) 99% 的 置信 上限. 

14.74 对 习题 14.46, 分 别 写 出 (a) Y 关于 X 的 回归 系数 , (b) 45 岁 妇女 血压 (с) 45 岁 妇 女 血 压 平 均值 的 
95% 的 置信 限 . 


第 十 五 章 ”多重 相 关上 与 偏 相 关 


多 重 相 关 


3 个 或 更 多 变量 间 存 在 的 关系 称 为 多 重 相关 .涉及 多 重 相 关 问 题 的 基本 原理 与 在 第 十 四 
章 中 所 讨论 过 的 简单 相关 的 基本 原理 类 似 . 


下 标记 号 

为 便于 推广 多 变量 问题 ,有 必要 用 到 下 标记 号 ， 

B Xi Xo Ху, 为 考虑 中 的 变量 , 再 令 Xi Хо, Xia,… 为 相应 变量 Xi MË, Xa, Ху, 
Хз, 为 相应 变量 Xa 的 值 等 等 . 利用 这 些 记号 , 则 和 式 Xa + Xa 十 … + Хәм 可 写成 
У)" Xa D Xy RAD X;. 在 不 引起 混淆 的 情况 下 , 我们 用 最 后 一 个 记号 .此 时 X， 
的 均值 可 写 为 :X， = 2) X2/N。 
回归 方程 和 回归 平面 


回归 方程 是 为 估计 某 因 变 量 值 的 方程 ,例如 从 上 自 变量 Х,, X3,… 估 计 X 的 值 的 方程 称 为 
X, 关于 X2 Хз, … 的 回归 方程 .用 也 数 记号 ,有 了 时 可 以 写成 X = Е(Х,, Хз, o) CRR X 是 
X2, Хз 等 的 函数 ) . 

对 三 变量 情形 ，X1 关于 X, Xs 的 最 简单 回归 方程 有 以 下 形式 

Ху = 0123 十 012.3 有 2 + b13.2K3 (1) 

其 中 bia, braf 6b13.2 是 常数 .如 果 我 们 在 方程 (1) 中 保持 X, 为 常数 , 则 Xi 5 X, 的 关系 曲 
线 图 是 一 斜率 为 br 3 的 直线 ;如 果 保 持 XX, 为 常数 , 则 Xi 5 Х, 的 关系 曲线 图 是 一 斜率 为 
b13.2 的 直线 .很 清楚 点 后 面 的 下 标 显 示 了 每 一 情形 中 为 常数 的 变量 的 下 标 . 

因为 Xi 随 着 X 或 X; 的 变化 而 有 部 分 变化 ,故我 们 称 Ьул 3 和 6513 ;分别 为 保持 XX 为 常 
数 时 Xi 关于 Х, 的 偏 相关 系数 或 保持 X 为 常数 时 Xi 关于 X; 的 偏 回 归 系 数 . 

方程 (1) 称 为 Xi 关于 Х,, X 的 线性 回归 方程 . 在 三 维 直 角 坐 标 系 中 , 它 表 示 一 平面 , 称 
之 为 回归 平面 ,是 第 十 三 章 中 所 讨论 的 两 变量 回归 直线 的 推广 . 


最 小 二 乘 回归 平面 的 正规 方程 


正如 存在 一 拟 合 二 维 散 点 图 中 N 个 数据 点 集 (X, Y) 的 最 小 二 乘 回归 直线 ,也 存在 一 氢 
合 三 维 散 点 图 中 N 个 数据 点 集 (Xi, Х,, X3) 的 最 小 二 乘 回 归 平 面 . 
X1 关于 X2, Хз 的 最 小 二 乘 回归 平面 具有 方程 (1) 形 式 ,其 中 0 ;3，b12 3 和 和 51 ,通过 同 
时 解 下列 正 规 方程 来 确定 : 
УЈХ, = Ь1.23№ + bi2.3 У) X2 + bi3.22) Хз 
УХХ, = Ьу 23 УХ; + Ьуз > X3 + b13.2 У) X2X3 (2) 
2 XIX3 = bi1.23 У! X3 + Брз У) Х.Х; + b13.2 У X3 
这 些 方程 通过 对 方程 (1) 两 边 依 次 乘 1, Х,, Х, 再 求 和 可 得 . 
除非 特别 说 明 , 以 后 任何 时 候 所 涉及 回归 方程 都 是 指 最 小 二 乘 回归 方程 
若 Xi = X] — Х|, zx2 = X2- Х», Хз X3 一 Хх, 则 Хх, 关于 X, 和 Хх,» 的 回归 方程 可 简化 为 


21 = b123 £2 + руз 223 (3) 


其 中 biz 3 和 b13 2 通过 同时 解 下 列 方程 而 得 ;: 

Dy rix2 = Буз У) 73 + b13.2 У) T223 

X rizs = 603) T223 + b2 Dy 3 (4) 
这 些 等 价 于 正规 方程 (2) 的 方程 可 通过 对 方程 (3) 两 边 依 次 乘 以 х2, хз 绸 求 和 而 得 . 
回归 平面 和 相关 系数 


若 变量 Xi 与 Xz Xi 与 X3, X2 与 XX 之 间 的 线性 相关 系数 按 第 十 四 章 中 的 方法 计算 ,分 
别 记 为 ро, ri 和 r2( 有 时 称 为 零 次 相关 系数 ), 则 最 小 二 乘 回 归 平 面具 有 方程 





X] ri 一 nera 2 713 — 712723 T3 (5) 
— ш ooo 一 2 
51 1 – ғ53 52 1 - r3, 5з 








其 中 zx1= XI1—X, rz2 = X,- X>, ху= X3- Ху, $1, $23 53 分 别 为 ХІ, X 和 X3 的 标准 差 ( 见 
J 15.9). 

Ta, ERE X; 不 存在 , 令 X=Y, X, = Хх, 则 方程 (5) 就 转换 为 第 十 四 章 中 的 方程 
(25). 


估计 的 标准 误差 | 
通过 第 十 四 章 (8) 式 的 推广 ,我 们 可 以 定义 Xi 关于 X, X 的 估计 的 标准 误差 为 
Е 2 
51.23 = үг Хе (б) 
其 中 Xi 是 由 回归 方程 (1) 或 (5) 计 算得 到 的 X, 的 估计 值 . 
根据 相关 系数 12, riz ҒЗ, 估计 的 标准 误差 也 可 由 下 式 计 算 ， 
l- ғ - ria 一 7З + 二 r12713 太 23 (7) 


1 一 723 
当 样本 容量 N 很 大 时 ， 第 十 四 章 中 所 讨论 过 的 两 变量 的 估计 的 标准 误差 的 有 关 说 明 ， 可 
通过 用 平行 于 回归 平面 的 平面 代替 平行 于 回归 直线 的 直线 而 推广 到 三 维 ( 即 三 变量 ) 情 形 {5 
计 的 标准 误差 的 一 个 较 佳 形式 可 表 为 
5123 = y N/(N 一 3)5 23 
多 重 相 关系 数 


明 过 推广 第 十 四 章 中 (12) 或 (14) 式 可 定义 多 重 相关 系数 ， 例如 ,对 有 两 自 变量 的 情形 , 多 
草 相 关系 数 可 由 下 式 给 出 ， 








| 2 
5 
Ri 23 = J1- Lao (8) 


其 中 s, 是 变量 X 的 标准 差 ， 5123 由 (6) 或 (7) 式 给 出 , 而 数 Ri 23 称 为 多 重 判 定 系 数 . 

对 于 线性 回归 方程 ， 多 重 相 关系 数 称 为 线性 多 重 相 关系 数 . 除非 符 别 说 明 , 我 们 所 说 的 多 
重 相关 都 是 指 线 性 多 重 相关 . 

根据 кр, ra 和 ra, (8) 去 可 写成 


2 2 
R _ [712 + ris — 2r12r13723 
123 = |” (9) 
1 = r3 


多 重 相关 系数 ,如 Ry, 取 0 与 1 之 间 的 值 系数 与 1 越 接 近 , 则 变量 间 的 线性 关系 越 好 ， 
越 接 近 0, 活性 关系 则 越 差 . 若 多 重 相关 系数 等 于 1, 则 该 相关 称 为 完全 相关 . 尽管 相关 系数 为 
0 表明 变量 间 没 有 线性 关系 ， 但 还 可 能 存在 某 种 非 线 性 关系 . 


内 变量 的 转换 


当 Xi 作为 因 变 量 时 ,上 述 结 论 都 成 立 . 然而, 若 我 们 把 X 而 不 是 X; 作为 因 变 量 时 , 我 
们 只 需 将 已 得 结论 中 的 下 标 1 换 成 3,3 换 成 1 即 可 .例如 由 方程 (5), X 关于 X; УХ, ЮЕ 
归 方 程 可 写成 














T3 23 ”7137 12 | 72 r13 ~ 723712 |2} 
о = 2 — 2 一 (10) 
这 里 用 到 结论 ; 
r32 一 Кэз, * Үз] = Кз, r231 = F12 


多 于 三 个 变量 的 推广 


多 于 3 个 变量 时 也 可 得 到 类 似 上 述 的 结论 .例如 , X 关于 X, X, Xs 的 线性 回归 方程 可 
写成 
Xı = p13234 十 D1234X2 + В Хз + b14.23X4 (11) 
表示 四 维 空间 中 一 超 平面 .通过 对 方程 (11) 两 边 依次 乘 以 1, X, X 和 X,, 再 求 和 即 可 得 确定 
常数 biza Рао, за» Боз 24, 014.23 的 正规 方程 ,再 把 这 些 确 定 的 常数 代入 (11) 式 就 得 到 了 X Ж 
F Х›,Х; 和 X4 的 最 小 二 乘 回 归 方 程 , 这 个 最 小 二 乘 回 归 方程 可 写成 类 似 于 方程 (5) 的 形式 
(见习 题 15.41). 


偏 相关 


通常 度量 因 变量 与 某 特定 自 变 量 间 的 相关 程度 是 很 重要 的 , 此 时 , 其 他 变量 都 保持 恒定 
以 消除 其 他 变量 的 影响 .这 个 相关 程度 可 以 通过 类 似 于 第 十 四 章 (12) 式 来 定义 , 称 之 为 偏 相 关 
系数 . 只 征 我 们 必须 考虑 在 有 与 没有 这 个 特定 自 变量 的 两 种 情况 下 所 引出 的 回归 平方 和 与 残 
AFAM. 
ERIH ғ, 3 记 为 保持 X; 恒定 时 , X 与 X, 之 间 的 偏 相 关系 数 , 则 有 
ноз = _ 713723 - (12) 
\ (1 — ria) (1 一 r33) 
问 样 地 , 者 保持 Хз, X4 恒定 , X 与 Х, 之 间 的 偏 相关 系数 记 为 >， WE 
ко = = ае _ 712.3 714.3724.3 (13) 
VO ~ гуу. 4)(1 ~ ? 23. 4) v0- rl43)(1 — r24 3 ) 
这 些 结论 是 非常 有 用 的 , 因为 通过 它们 , 所 有 偏 相关 系数 都 可 最 终 只 依赖 于 相关 系数 r12 T23 
FF. 
在 两 变量 X 与 Y 情形 中 ,车 两 回归 直线 有 方程 :Y=ao+alX ХЕБ + bi Y, 我们 可 知 
二 a1b1( 见 习题 14.22). 这 个 结论 能 够 被 推广 .例如 ,车 


Хү =01234 + b12.34X2 + Буз Хз + Ба 23X4 (14) 
Ха = 643 + 041.23X1 + b4.13X2 + Баз 12X3 . (15) 

分 别 为 Xi 关于 X2, X3, X4 及 Xs 关于 X1, Xa, Xs 的 线性 回归 方程 . 则 有 
r14.23 = b14.23b41.23 (16) 


(元 习题 15.18). 这 可 以 作为 线性 偏 相关 系数 定义 的 出 发 点 . 
多 重 相关 系数 与 偏 相关 系数 之 间 的 关系 


关于 多 重 相 关系 数 ， 我 们 能 找到 一 些 有 趣 的 结论 .例如 ,我 们 有 
1 ~ Кї» = (1- r12) (1 ~ r13.2) (17) 


1— R? 234 = (1- ri2) (1 一 r13 2)(1 一 r14 23 ) 


些 结论 的 推广 很 容易 得 到 . 
非 线 性 多 重 回归 


关于 线性 多 重 回 归 的 上 述 


关系 数 也 可 用 类 似 上 述 方法 来 定义 、 


习题 及 解 管 


涉及 三 个 变量 的 回归 方程 
用 一 适当 的 下 标记 号 写 出 (a)X, 关于 X, M ХЗ, (b)X3 关于 Х\,Х» 和 X4, (с) Х; 关于 


18.1 


15.2 


Х\,Х›,Х» M X, 的 回归 方程 . 
解 > (а) Xs = 6b2.13+ Ьу Ху + bo3.1X3 


(b)X3= 63.124+ b31.24X1 + b32.14X2 + b34.12X4 


(с) Х5 = bs.1234 + бз 234X1 + b52.134X2 + bs3.14X3 + Б рз Ха 


(18) 


结论 能 推广 到 非 线 性 多 重 回归 情形 , 此 时 多 重 相关 系数 与 偏 相 


写 出 对 应 回归 方程 (a)X3 = 6b3.12 + b31.2X1 + 6з 1 X, (b) Xi = 61.234 + b12.34X2 + b13.24X3 


+ bi14.23X4 的 正规 方程 . 
解 F (a) 相 继 用 1, Xi 和 X 乘 方程 两 边 , 并 求 和 即 得 正规 方程 
>) X3 = b312N + Би; У) Xi + фуу У)Х, 
Ў Х,Хз = b32), Xi + Ьу; УХХ + bya УХХ, 
У Х.Х = b312 УХ; + baa X XiX + Ьу X X? 
(b) 相 继 用 1, X2, X3 和 X4 乘 方程 两 边 ,并 求 和 即 得 正规 方程 
ХХ, =61.234N + b3 УХХ + b13.24 У) Хз + 51423 УХ, 
Ў XiX2 =b1.234 Ў) X2 + Боза УХХ + bi324 УХХ + b14.23 > XX 
DX1Xs =. У) X3 + Бо УХХ. + bia УХ + Быз > X3X, 
Dy XiX4 =b1.234 У) X4 + Буу ы У) Х,Х, + b13. 2) X3X4 + bi4.23 У Х2 
表 15.1 给 出 了 12 个 男孩 的 体重 X, 身高 X, EH X. 
(а)Ж Х, 关于 Х.Х, 的 最 小 二 乘 回归 方程 . 
(b) 由 给 定 的 Xz, Хз 的 值 确定 Xi 的 值 . 
(c) 一 男孩 9 岁 ,身高 54 英寸 ,估计 其 体重 . 
(d) 给 出 (a) 的 Minitab Ж. 










体重 (X1) 55 | 58 [т Т Т5 | 
ре реа аре ши 










# Е (а)х, РХ, Хх, 的 线性 回归 方程 可 写成 


Ху = biz + 61 3Х, + 613.2 Хз 
其 正规 方程 为 


УХ, = b1.23N + b12.3 УХ, + b13.2 > X3 
XXX, = b123 > X} + b23 > X? + b13.2 >) XX; 


> XIX; = b1.23 > X3 十 b123 >，X2X3 十 bi13.2 У) X? 


(19) 


15.4 


涉及 和 的 一 些 计 算 由 表 15.2 给 出 , 则 上 述 正 规 方程 为 












































表 15.2 
Х| | X? X3 Xi X3 Xs XIXa ХХ | XX3 
64 57 8 4096 3249 64 | 3648 512 456 
71 59 10 5041 3481 100 4189 710 590 
53 49 6 2809 2401 36 2597 318 294 
67 62 11 4489 3844 121 4154 737 682 
55 51 8 3025 2601 64 2805 440 408 
58 50 7 3364 2500 49 2900 406 350 
77 55 10 5929 3025 100 4235 770 550 
57 48 9 3249 2304 81 2736 513 432 
56 52 10 3136 2704 100 2912 560 520 
51 42 6 2601 1764 36 2142 306 252 
76 61 12 5776 3721 144 4636 912 732 
68 57 9 4624 3249 二 81 3876 612 513 
2 Xı DX% JRB | Ухх, Ухх, | YD Xx 
= 753 = 34843 | = 976 = 40830 | = 6796 = 5779 

120,3 + 643Ь};› з + 1066}; › = 753 

643р 23 + 34843}, 3 + 57790}; 2 = 40830 (20) 

1062; 23 + 57796} 3 + 9766;3 2 = 6796 

解 得 
bi 23 一 3.6512, ба з 一 0.8546, bi3 > = 1.5063 
故 所 求 回 归 方 程 为 


Хү = 3.6512 + 0.8546Х» + 1.5063Х, (21) 
有 避 开 解 联 立方 程 组 的 另 一 方法 ,见习 题 15.6. 
(b) 利 用 回归 方程 (21), 通过 代入 相应 的 X 和 X 的 值 , 求 得 X, 的 估计 值 , 记 为 Хо. А, ЕХ, 


= 57, Хз= 8 代入 (21) 式 , ENIF Х| „= 64.414, 其 他 相应 的 X, 的 估计 值 可 以 用 相同 方法 得 到 , 见 表 
15.3. 


表 15.3 


Ху, е |64.414 69.136 54.564 73.206 59.286 56.925 65.717 58.229 63.153 48.582 73.857 65.920 


Хх, 64 71 53 67 55 58 77 57 56 51 76 68 


(с) X2 = 54, X= 9 代入 方程 (21), 即 得 估计 值 Ху. = 63.356, 或 大 约 为 63 ЁЁ. 

(d) 体 重 记 入 第 一 列 ， 喘 高 记 入 第 二 列 ,年 龄 记 入 第 三 列 , 命令 Regress ‘Weight’ оп 2 predictors 
‘Height’ and'age' .输出 结果 如 下 .方程 Weight =3.7+0.855Height + 1. 51Аде 与 上 述 得 到 的 结果 一 
20, ВХ, =3.65+ 0.855Х,+1.506Х,. 

MTB > Regress‘ Weight’ on 2 predictors ‘Height’ and ‘Age’ 

The regression equation is 


Weight = 3.7 + 0.855 Height + 1.51 Age 


Predictor Coef StDev T P 
Constant 3.65 16.17 0.23 0.826 
Height 0.8546 0.4517 1.89 0.091 
Age 1.506 1.414 1.07 0.315 


S= 5.363 К - Sq = 70.9% R- Sq(adj) = 64.4% 


对 习题 15. 3 中 数据 求 标准 差 . (a)sı, (b)sz, (с)». 
解 EF (д); 是 变量 X， 的 标准 差 , 则 用 表 15.2 中 数据 ,利用 第 四 章 方法 ,得 


15.6 


15.8 


2 | А 2 
_ 2x Xx] - 48139 _[753) -= 8.6035 或 8.6 Eš 
ON 


х? 2 2 
， Ух Уух," 34843 _ | 643] = 5.6930 或 5.7 英 十 
2 \ М М 


12 12 


_ /OX >) 226 [106\ | 106) 1.8181 或 1.8 年 


对 习题 15.3 в. Жазуы. Ж (c)ra. 
E F (a) 数 -是 变量 Xi 与 X; 之 间 的 线性 相关 系数 , 则 用 第 十 四 章 中 方法 . 有 


[Nyl Ex) JNE- (Sx,)’] 


_ 12 x 40830 — 753 x 643 - 0.8196 3È 0.82 
/ [12 х 48139 – 7532][12 х 34843 – 643°] 


СЪ) (с) 用 相应 的 公式 ,可 得 у; = 0.7698 3 0.77, ra= 0.7984 或 0.80. 
用 本 章 方程 (5) 及 习题 15.4 和 习题 15.5 的 结论 , 求 习 题 15.3(a). 
解 S 在 方程 (5) 两 边 乘 以 s W XI 关于 X, X 的 回归 方程 变 为 


r 一 r 
ЕИ (22) 


1 © Кэз 53 


(b) 











ү 一 


ri2 — F13723 51 
”oo — ту + 


2 
I- r33 





$2 
其 中 х= Xi- Ху, т;=Х›-Х›, r3=X,- Ху. MIS 15.4 及 习题 15.5 的 结论 , 则 方程 (22) 变 为 
xı = 0.8546бх, + 1.5063» 


>X, _ 753 


N 12 = 62.750, X, = 20. = 53.583, X3 = 8.833, 则 所 求 方程 可 写 为 
XI – 62.750 = 0.8546(Х, — 53.583) + 1.506(Х, — 8.833) 

与 习题 15.3(a) 中 结论 一 - 致 . 

对 习题 15.3 中 数据 求 (a) 相 同年 龄 男孩 , 再 增加 一 英寸 高 度 , 其 相应 的 体重 平均 增 量 ， 

(b) 相 癌 映 高 男孩 ,每 年 的 体重 平均 增 莉 . 

解 ЕЕ 由 所 得 回归 方程 ,可 解 得 (a)0.8546 8 0.9, (Ь)1.5063 ў 1.5 8. 

证 明 本 章 方程 (3) 和 (4) 由 方程 (1) 和 (2) 所 得 


E S 对 方程 (2) 中 第 一 个 式 子 两 边 间 除 以 N, 得 


因为 X = 


XI = bi23+ bi2.3 Xa + буз; X3 (23) 
用 方程 (1) 减 去 方程 (23), 得 
Хү 一 Хх, = b12.3(X2 — X) + bi3.2(X3 — Ху) 
或 
ху = буузх) + фуз 223 (24) 
即 为 方程 (3). 


设 XI = zx1+ Х|, X, = r2 + X,, Хз= 23+ Хз, 代入 方程 (2) 的 第 二 、 二 式 ， 通过 代数 式 简化 ， 8 
由 结论 У\ zl = >т; = > ,za = 0, 则 得 
У! 2» = b23 У) 25 + b13.2 Ў) X273 


+ МХ,[ 5, 23+ bi23 Х + bi32 Хз — Х|] (25) 
Ў 2123 = буз У) T223 + bli32 У\ 25 
r МХ; bia + Брз X2 + biza Ху Х|] (26) 


由 方程 (1) 知 (25) (26) 式 等 号 右边 丸 方 括号 中 的 值 为 0, 即 得 方程 (4) 式 . 
妇 一 解法 见习 题 15. 30. 


15.9 建立 方程 (5), 即 


Xl 712 一 „нш ”13 712723 za) (5) 
— = 2 pai 2 
51 1 一 753 52 1 一 ”23 53 














Ж F 由 方程 (25)、(26) 得 
Ьу; 3 Уу? + bi3.2 >》， 工 2 工 3 = Ухх; 
b123 У) 223 + b13.2 Уу 25 = У! riz (27) 


因为 

, ry дуз 

27 ү’ з= 
则 

Sla м Dai- м 
又 因为 
У} 2223 Е У} 2223 
"а)ба Ms 
则 
ЭК? = Ns2s3723 
同样 有 
XY riz? = Nsiszr12, У? ziz; = Ns153r13 

代入 (27) 式 ,简化 后 得 

012 352 + D13.252723 = S1712 

012.352723 + 013,253 = S1713 (28) 
同时 解 方 程 (28) 得 

каз = | 
l \ l-rj 52 l- r33 53 
把 这 些 代入 方程 zl = 512 эх; + 613.2x3, 再 两 边 除 以 s 即 得 结论 . 
估计 的 标准 误差 


15.10 对 习题 15.3 中 数据 , 求 X 关于 Х,, Х, 的 估计 的 标准 误差 
Ж EF 由 表 15.3 得 


> (Xi 7 Xr 
51.23 一 М 
_ [064 – 64.414} + (71 – 69.136)? + - + (68 — 65 920)? 
р 12 


=4.6447 54.6 
修正 的 总 体 估计 的 标准 误差 为 


51 23 = y МОМ 一 1)s1 23 一 5.3 8 


2 
l-r 一 r13 一 r23 十 27127r13723 


15.11 用 s1 = 5; 来 求 习 题 15.10 的 结论 . 


2 
1—5» 


Ж EF 由 习题 15.4(a) 和 15.5 结 论 , 有 





1 ~ 0.8196° — 0.7698: - 0.7984? + 2 x 0.8196 x 0.7698 х 0.7984 
1 – 0.7984? 





51.23 = 8.6035 


=4.6 ## 
注意 ,用 这 种 方法 求 估计 的 标准 误差 可 以 不 用 回 归 方 程 . 


多 重 相关 系数 


15.12 


15.13 


15.14 


15.15 


对 习题 15.3 中 数据 , 求 Xi 关于 X X 的 线性 多 重 相 关系 数 . 参照 习题 15.3 中 
Minitab 解 来 确定 线性 多 重 相 关系 数 . 


М E 解法 一 从 习题 15.4(a) 和 习题 15.10 的 结论 可 得 





52 
Ri1 23 = 一 二 = /1 46447 = 0.8418 


解法 二 ”由 习题 15.5 的 结论 可 得 


2 2 
о + ri ~ 2ri2ri3r23 
R1.23 = 2 
1- r23 


0.8196? + 0.7698? — 2 x 0.8196 x 0.7698 x 0.7984 
1 – 0.7984? 


注意 , 多 重 相 关系 数 РК, nak > 或 3 都 大 (见习 题 15. 5) .这 始终 是 正确 的 ,也 是 可 以 料想 的 . 
因为 增加 了 有 关 自 变量 , 我 们 应 该 得 到 变量 之 间 的 较 好 的 相关 性 . 
在 习题 15.3 中 Minitab 输出 R? ›; = 0.709, 因此 


Riz3 = / 0.709 = 0.802 
对 习题 15.3 中 数据 求 Xi 关于 Х,, Х, 的 多 重 判 定 系数 .参照 习题 15.3 的 Minitab 解 
来 确定 多 重 判定 系数 ， 
解 F Xi 关于 Х,,Х, 的 多 重 判 定 系 数 为 
R123 = (0.8418)? = 0.7086 
由 习题 15.12 中 结论 , 知 Xi 的 变 差 约 占 总 变 差 的 71% . 
由 习题 15.3 的 Minitab 输出 可 直接 得 到 多 重 判定 系数 . 
对 习题 15.3 中 数据 ,计算 (a) К› 1з, (b) R312, 并 把 它们 与 Ri „ЕН. 
解 EF (a) 


R КОЕ Sr12713723 
213 = 1 — rê, 
| 0.81962 + 0.7984? — 2 x 0.8196 x 0.7698 x 0.7984 
= ”rr 一 一 一 
1 – 0.76982 0.8606 


2 2 
R _ [тїз t ri ~ 2r12713723 
3.12 = 1 2 
T Р] 


ч sa Е 








= 0.8468 


(b) 








0.79842 - 2 х 0.8196 x 0.7698 х 0.7984 
1 — 0.81962 


此 例 说 明 :一 般 情 况 下 , К, 5, Ra ,和 Ri 323 未必 相 等 . 
Ё К, з= 1, ВЕН (а) Кзџ5= 1, (6) В; р=1. 


证 明 ES 
7» +r? Rrrr 
А _. 
Rin = 13 一 站 132713723 (29) 
1 一 23 
r? +r? 2rioriar 
12 7 
Rop = 23 T12713723 (30) 
1 一 r13 


(a) 在 (29) 式 中 , 设 Ri 23=1, 再 对 两 边 求 平方 ,得 






0.7698? + 





0.8234 


2 2 2 
riz + кїз 一 Zrl2rl13r23 = 1 — r5 
则 有 


2 2 2 
riz + r33 — 2ri2r13723 = l — ris 


15.16 


偏 相关 


15.17 


15.18 


15.19 


2 2 - 
п + ‚тз 2710713703 _, 
и -= 
] — ris 


即 R? ;=1 或 Ri3=1l, 因 为 多 重 相关 系数 非 负 ， 
(b) 同 上 ,可 得 К = 1. 

Ё К,53=0, 8 К 13=0 14? 

解 ке 由 (29) 式 可 知 К, 23=0 当 且 仅 当 


2 2 2 2 
ri + кїз 2rprsar2 = 0 或 2rtri3r23 = ri + rl 


2 2 2 2 2 2 

рир + коз (rtr) _ риз ry 
Кз = 2 一 2 
l- ri 1 — ri 


则 由 (30) 式 有 


ЁП К, ww: 未必 为 0. 


对 习题 15.3 中 数据 , 求 线 性 俩 相关 系数 (a)riaz 3,(b)7ria 2，(c)r23.1. 
解 > 
_ riz ~ 13723 
a- oa- 
Гіз rper 
Var ra) 
”23 712713 
r23.1 一 A A r 一 У 7 25 
利用 习题 15.5 的 结论 可 得 rm 3 0.5334, күз = 0.3346, r23.1=0.4580. 这 说 明 , 对 相同 年 龄 的 男 
孩 ,其 体重 与 身高 间 的 相关 系数 为 0.53; 对 相同 身高 的 男孩 , 其 年 龄 与 体重 间 的 相关 系数 为 0.33. 
因为 这 些 结论 仅 是 由 12 个 男孩 的 样本 得 出 的 ,当然 没有 大 样本 所 得 绩 果 那么 可 靠 , 
F Ху = b123 + Бу; 3Х› + bi3.2X3 M Хз = Бзр + 5з; |Х; + 6b31.2Xi 分 别 为 Xi 关于 
X2, Хз 和 X, 关于 X2，Xi 的 回归 方程 ,证 明 v13 ,= 613 2031 2 


证 明 要 XI 关于 xX, Х, 的 回归 方程 可 写成 ( 见 本 章 方程 (5)) 





х. -| [| ex, - X3) 
r23 + \ 52 
t- r3 53 
而 X3 关于 X, X 的 回归 方程 可 写成 (见方 程 (10)) 
чо _ [23 T3712 | | 53 7 
5 = | 1 ~ ri сх, X2) 
ae rari (X, ~ Xi) (32) 
-~ М2 51 





由 方程 (31) 和 (32) 可 得 X; 与 Xi 的 系数 分 别 为 
13 7 120723 | | 51 {73 ЗТ | s3 
01322 р | 1 一 r33 | | J > бзу2 E | 1- ris | | 51 | 
因此 


2 
(riz — riz 723) 


013.20312 = = ү? 
13.2031.2 (1 r} )(1 _ г2,) 13.2 





ла l-r? 1—7, 
Ят гуз = 0, ЙЕН (а) ris 2 = ris ТЕ. raara | А 
ку) 


证 明 EF # roas кше шс =0,Щ4{ r rra. 
(1—г1;)(1-—гзз) 


六 13 7 КүуКОоз күз (к1зг;з) эз 


(a)ri := 7 
аА) 13.2 (1 - r3) - r2) 、 (1 ~ r12)(1— 3) 


зб кз) |1 
Хатой) "1-5 
(b) 交 换 (a) 中 工 与 2 的 位 置 即 得 (b) 结 论 . 
涉及 四 个 或 更 多 变量 的 多 重 或 偏 相关 
15.20 一 大 学 入 学 考试 涉及 三 门 课程 :数学 英语 和 常识 .为 了 通过 考试 效果 来 预测 统计 课程 
的 成 绩 , 现 对 200 名 学 生 的 数据 进行 收集 和 分 析 . 设 X= 统计 课程 成 绩 , X = 英语 测 
试 成 绩 , Хз = 数学 测试 成 绩 , X4 = 常识 测试 成 绩 . 由 数据 算得 Xi = 75,5, = 10, X = 
24, s2=5, X3=15, s3=3, X4=36, s4=6,712=0.90, rı3=0.75, ri4=0.80, ғ; = 
0.70, r24=0.70, r34=0.85, Ж X, 关于 Х,, X3, X, 的 最 小 二 乘 回归 方程 . 
# F 推广 习题 15.8 的 结果 , 则 Xi 关于 X, X, X 的 最 小 二 乘 回 归 方 程 可 写成 


тү = бу з42) + буз 2423 + Буа әзла (33) 


其 中 5b12 м, Буз Айй 6b14.23 可 由 正规 方程 : 
У) 12; = Ьа У 22 + Буза У) 2223 + bi4.23 2 ) әла 
X rizs = bi12.34 > T273 + bi3.24 У) x3 + bi4.23 У) зла (34) 
D хул = b12.34 2) T224 + b13.24 200324 + буз 2 4 


解 得 , 其 中 zl= Xi- Ху,т›= Х,- Ху,ху= X3- Ху,ха= 久久 ,由 数据 算得 
Уух; = Ns? = 5000 


У! 22) 一 Ns1s2r12 = 9000 


Уутуху = Nsisarzs = 2100 
Dx? = №2 = 1800 
ЭК? = Nsisa3r13 = 4500 
ЭКЕ? = Мззагол = 4200 
> ,zi = Ns? = 7200 
У! riz4 一 Ns154ar14 = 9600 
У! ез4 = NS354r34 = 3060 
把 以 上 结果 代入 方程 (34) 可 得 
б 12.34 一 1.3333, D13 24 一 0.0000, фал. эз 一 0.5556 (35) 
再 代入 方程 (33), 则 得 所 求 回归 方程 
ху = 1.33332. + 0.5556x, 
或 
Ху - 75 = 1.3333(Х, ~ 24) + 0.5556(Х, – 27) (36) 
Rp 
Х, = 22.9999 + 1.3333Х, + 0.5556X, 


方程 (34) 的 精确 解 为 51, = 4, bi13.24 = 0, Б зз = 2, 故 回归 方程 也 可 写成 


Ху = 23 + 1x, + 2х, (37) 
注意 一 个 有 趣 现 象 :回归 方程 中 没有 涉及 X3, 即 英语 成 绩 ,这 并 非 说 明 统计 成 绩 的 预测 不 依赖 


于 英语 成 绩 .相反 ,这 说 明了 统计 成 绩 对 英语 分 数 的 需要 已 充分 体现 到 了 其 他 分 数 当 中 ， 


15.21 


15.22 


15.23 


15.24 


15.25 


在 习题 15.20 中 已 知 有 两 名 学 生 的 入 学 考试 成 绩 分 别 为 : 
(a)30,18,32;(b)18,20,36. 问 他 们 统计 成 绩 预 测 为 多 少 分 ? 

解 ES (a) 把 Х,=30,Х,=18,Х,= 32 代入 方程 (37), 即 得 X = 81. 
(b) 同 理 ,得 Xi = 67. 

对 习题 15.20 中 数据 ， 求 偏 相 关系 数 (a) 71 34， (b) куз. әд, (C)r14.23. 
解 G 和 (a) 和 (b) 


7i2 — 714724 r _ Р 13 ~ T14734 
riza © 5, 13.4 一 5 
JO- ra)(l ria) V= ria) =- r34) 
r23 — 724 34 | 
riaa 一 5 5. 
м (1 =- е4) (1 r34) 
由 习题 15.20 中 数据 , 可 得 ra ,= 0.7935, ri = 0.2215, r) = 0.2791. Ж 
riza = 2 -4 — 0.7814 
V- ri3.4)(1 risa) 
risa = = rj? а 4. = 0.0000 
y (1 © 了 了 12 4) (1 一 r334) 


六 14 ?13724 12° 131723 724 ”六 23 六 34 


(c) ға з= Роз 4р у= MM 
C) ri4.3 O- ra) (1 a) (1-13) (1 r33) 7 М (1 053) (1-24) 


由 习题 15.20 数据 ,得 ri з = 0.4664, гі: з = 0.7939, »., 50.2791. {В 
гыз эз = == 12.3703 = 0.4193 
¥ (1 = rr12.3)(1 — r543) 
解释 习题 15.22 中 所 得 (a) ri 4, (Ы) гуз, (е) 12.34» (9) 714.3, (е) 714.23: 


解 EF (а) ғ. =0. 7935 代表 有 相同 常识 分 数 的 学 生 的 统计 成 绩 与 数学 分 数 之 间 的 线性 相关 系 
数 ,其 中 不 考虑 学 生 的 英语 分 数 . 
(b)ri3.4=0.2215 代表 有 相同 常识 分 数 的 学 生 的 统计 成 绩 与 英语 分 数 之 间 的 线性 相关 系数 ， 其 中 
不 考虑 学 生 的 数学 分 数 ， 
Ce) riz. 34 = 0.7814, 表示 有 相同 英语 分 数 和 相同 常识 分 数 的 学 生 的 统计 成 绩 与 数学 分 数 之 间 的 线 
性 相关 系数 . 
(9) r14.3= 0.4664, 表示 有 相同 英语 分 数 的 学 生 的 统计 成 绩 与 常识 分 数 间 的 线性 相关 系数 ， 其 中 不 
考虑 学 生 的 数学 分 数 ， 
(е) rz 二 0.4193, 表 示 有 相同 数学 分 数 和 相同 英语 分 数 的 学 生 的 统计 成 绩 与 常识 分 数 间 的 线性 
相关 系数 
(a) 对 习题 15.20 中 数据 验证 

_ = == (38) 

у (1 — ri3.4)(1 — рэза) v (1 — ria3)(1 — r543) 

(b) 解 释 (a) 中 等 号 明显 成 立 . | 
解 F (a)(38) 式 左边 的 值 等 于 0.7814( 由 习题 15.22(a) 可 得 ), 再 由 15.22 中 结论 可 知 (38) 式 
右边 的 值 也 等 于 0.7814， 故 (38) 式 等 号 成 立 .直接 用 代数 运算 也 可 证 明 一 般 情 况 下 该 等 号 成 立 . 
(b)(38) 式 左边 为 2.34, 右边 为 мр аз, 而 r12.34 是 保持 X3, X, 为 常数 ,变量 X, 5 X, 间 的 相关 系 
数 , riz.43 则 是 保持 X4, X3 为 常数 ,变量 Х, 与 X: 间 的 相关 系数 , 由 此 明显 得 出 等 号 成 立 . 
对 习题 15.20 中 数据 , 求 (a) 偏 相关 系数 Ri.234, ОИЕ з, ,34 的 标准 误差 . 
E 887 解法 一 (a)1- Ком (1-0) (1-2) (1-0, 23), 由 习题 15.20 知 4s=0.90, 而 
由 习题 15.22(c) 知 кы 5: = 0.4193, 


б = ү r 
гїз.2 = HHB — — (уо 3855 


Va- rh) - rh) 


故 得 Куә = 0.9310 . 


解法 二 ”交换 开头 方程 中 下 标 2 与 4 的 位 置 , 则 得 
1- Ria=(t-r(l-ro(-raa) 或 Ri = 0.9310, 


其 中 直接 利用 习题 15.22(a) 中 结论 . 
(b) Е, з. = | 1- 51.234 өр s1.234 = S1 V1- R? 2334=10 V1- (0.9310)? = 3.650 
51 
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涉及 三 个 变量 的 回归 方程 


15.26 用 恰当 的 下 标记 号 , 写 出 (a)X3 关于 Xi, Х,, (ЫХ, 关于 X, Х,, X; 和 Xe 的 回归 方程 . 
15.27 ” 写 出 (a)X2 关于 Х|, X3, (b)Xs 关于 X1, X2, X, 和 X, 的 回归 方程 的 正规 方程 . 
15.28 表 15.4 给 出 了 变量 Xi, X, 和 X, 的 对 应 值 . 

(а)Ж X 关于 Х|,Х, 的 最 小 二 乘 回 归 方 程 ; 

(b) 当 Xi = 10,X2=6 时 估计 X, И. 





15.29 ”一 数学 教师 想 测定 期 末 考 试 成 绩 与 该 学 期 中 两 次 小 测验 成 绩 的 关系 , 假定 X, X 和 X 分 别 表示 学 
生 第 一 次 测验 , 第 二 次 测验 和 期 未 考试 的 成 绩 . 他 对 120 名 学 生 的 成 绩 统计 分 析 得 i =6.8,Х, = 
7.0,Х,=74,5,=1.0, 5=0.80,53=9.0, ғ; =0.60, у= 0.70, кз = 0.65, 

(a) 求 X, 关于 Х,,Х, 的 最 小 二 乘 回 归 方 程 ， 
(b) 已 知 两 名 学 生 的 两 次 小 测验 成 绩 分 别 为 (1)9,7;(2)4,8, 估计 这 两 名 学 生 的 期 末 成 绩 ， 

15.30 ”通过 选择 变量 X,, X 使 得 УХ, = > Xs = 0 来 解 习题 15.8. 


估计 的 标准 误差 

15.31 对 习题 15.28 中 数据 , 求 X, 关于 Xi, X 的 估计 的 标准 误差 . 

15.32 ”对 习题 .15.29 中 数据 , 求 (a) XX 关于 Xi, X2, (b) Xi 关于 多,, Xa 的 估计 的 标准 误差 
多 重 相关 系数 


15.33 对 习题 15.28 中 数据 , 求 X 关于 X, X 的 线性 多 重 相关 系数 
15.34 对 习题 15.29 中 数据 , 计算 (a) Rip, (b) Rj.23, (с) К 13. 
15.35 (а) Ж ғ, == к, = r#Æ1, ШЕВ 
Ri23 = К.у = Кур = 722 
(b) == 1 时 对 (a) 进 行 讨论 . 
15.36 Ж R12;=0， WHA i ral>lrol Elira 121,1, ЕНЕ Е ЕЕ. 


偏 相关 


15.37 对 于 习题 15.28 中 的 数据 ,计算 线性 偏 相 关系 数 (a) 12.3, (6) ә, (с)г›з 1; 并 对 结论 作出 解释 . 
15.38 对 于 习题 15.29 中 的 数据 ,求解 习题 15.37. 
15.39 Ærp= r13 = ra 二 7 天 1 证明 кү, з = r13.2 = 723 1 = тү М r=1 时 进行 讨论 . 


15.40 Æ ri23=1, WEB (a)l гу; ,| =1, (6) 17,311 =1, (с) Ri 3=1 (4)5, 350. 
涉及 四 个 以 上 变量 的 多 重 相关 和 偏 相关 
15.41 证 明 X, XF Xi ХХ, 的 回归 方程 可 写成 


15.42 


15.43 
15.44 
15.45 


т т x Ta 
jr 22| 122, 
54 * | S21 àg 
其 中 aa, Ж аз 由 如 下 方程 组 给 出 : 
аук F darja + азу = ғу 


aira 十 42722 T G3723 = ғ 

arz ъа, ға + Urag = Fag 
H х= Х,-Х,,)=1,2,3,4. E EREET 4 个 的 情形 
Ж X,=20, X, =36, X3=12, X4=80, sı =1.0, s, =2.0, s,=1.5,s,=6.0, r= -0.20r =0.40, 
r23 = 0.50, ғ. = 0.40, ra4=0.30 以 及 ra4= - 0.10, (а) 写 出 Xi 关于 Х,,Х, 和 Х, 的 回归 方程 , (b) 
当 XIi=1$,X;=40,X3=14 时 估计 Ха. 
对 习题 15.42 中 的 数据 ,计算 (a)r оз, bra 3 和 (ec)r ро, 并 对 结论 作出 解释 
对 习题 15.42 中 的 数据 , Ж (а) К, 1w 和 (b)s。 123. 
某 科学 家 收集 了 4 个 变量 Т, U, V, W 的 数据 , 并 认为 变量 间 存 在 关系 多 = ату“, М ш, b, c,d 
是 未 知 常数 .通过 上 述 等 式 ,他 可 以 由 T, U,V 的 信 来 估计 Ww. УО a,b,c d 的 值 
(提示 ;可 对 等 式 两 边 取 对 数 ). 


方差 分 析 的 目的 


第 八 章 我 们 通过 抽样 理论 ,在 总 体 方差 相同 的 假定 下 ,对 两 总 体 均值 差异 的 显著 性 进行 了 
检验 .在 许多 情况 下 有 必要 对 3 个 或 更 多 样本 均值 差异 的 显著 性 进行 检验 ,或 者 等 同 于 去 检验 
零 假 设 :样本 均值 全 相等 . 

例 1 设 在 农业 试验 中 , 对 4 块 土壤 进行 了 不 同 的 化 学 处 理 , 小 麦 的 平均 产量 分 别 为 :28， 
22, 18, 24( 薄 式 尔 /英亩 ). 那 么 这 些 均 值 之 间 是 否 有 显著 性 差异 ,或 者 仅 因 为 随机 误差 而 造成 
观测 值 不 一 致 ? 

这 样 的 问题 能 通过 运用 Fisher 提出 的 一 个 重要 方法 ;方差 分 析 得 到 解决 , 它 主 要 利用 第 十 
一 章 已 经 讨论 的 下 分 布 . 


单 向 分 类 或 单 因 素 试 验 
在 单 因 素 试验 中 , 获得 а 组 独立 的 样本 观察 值 ( 或 观测 值 ), 每 组 所 包含 的 观测 值 数目 为 
6 .我 们 就 说 有 a 个 处 理 或 水 平 , 每 个 处 理 重 复 b 次 .在 例 1 中 ,a =4. 


单 因素 试验 的 结果 以 a 176 列 的 列表 表示 , 见 表 16.1. 此 处 X,, 表 示 第 j 行 第 & 列 的 观测 
值 ,j=1,2,…,a,k=1,2,…,b. 例 如 六 3 表示 第 三 个 处 理 第 五 次 试验 的 观测 值 . 


表 16.1 





用 又 .表示 第 7 行 观测 值 的 均值 , 则 


1 ~ | 
Х,. = ъ 2: Хь. ј = 1,2, a (1) 
= | 


X, .中 的 点 表示 对 下 标 已 被 求 和 .总 .被 称 之 为 组 均值 , 处 理 均值 或 行 均 值 .总 均值 即 a 
个 组 所 有 观测 值 的 平均 值 ,用 Х 来 表示 , 即 


X = 252) >, Xn (2) 
总 变 差 , 组 内 变 差 和 组 间 变 差 
我 们 定义 总 变 差 V 为 每 一 观测 值 与 总 均值 X 的 离 差 平方 和 : 


ВЖ = V= > (X-X? (3) 
对 Xa X 进行 拆 分 7 
Х»-Х = (Хь - Х,.) + (Х,. – Х) (4) 
然后 平方 ,并 对 р, k 求 和 得 到 (见习 题 16.1) 
2 (Xa - Х)? = У(Х» = KX) + У(Х. -XY (5) 


或 


> (Xy — Х)? = > (Xa = X, PAX, - XY (6) 
我 们 把 等 式 (5)， 6) 右边 的 第 一 个 和 式 称 为 组 内 变 差 用 Vw 来 表示 它 , 即 


Vw = 2 (Xi - х;.)? (7) 
等 式 (5)， OO 用 Vs 表示 , 即 
= X (X -XP = 602 (X. -X7 (8) 
因此 等 式 (5),(6) 可 以 写成 
V = Vø + Vg (9) 
计算 变 差 的 快捷 方法 
为 了 减 小 计算 上 述 变 差 的 工作 量 , 可 以 采用 下 面 的 形式 来 表示 
_ 2 T 
V = 20% - а (10) 
Vg TDH - T (11) 
Vw = М – Vs (12) 
其 中 
T = Xa» | = ХХ, (13) 


实际 上 ， ARENES REMERA E, 计算 起 来 更 方便 ， 且 对 最 终 的 结果 没有 
影响 . 


方差 分 析 的 数学 模型 
我 们 把 表 16.1 的 每 一 行 看 作 是 取 自 某 一 处 理 ( 或 水 平 ) 所 对 应 总 体 的 容量 为 8 的 随机 样 


本 ,Xi 与 第 j 种 处 理 所 对 应 的 总 体 均值 y 之 间 有 一 随 机 误差 或 机 会 误差 ,用 。 ,来 表示 它 , 则 
Xs = 4, + Ek (14) 


这 些 误差 被 认为 服从 均值 为 0, 方 差 为 P 的 正 态 分 布 , Фи = Уша, = p u и, 

= u 十 «;. 等 式 (14) 变 为 
X k = uta ter (15) 
其 中 Ха, = = 0( 见 习题 16.9) .从 等 式 (15) 和 假设 ep ~ №0, 0°), 我 们 能 推断 出 X;; 是 服从 均 


ID p t ay, ED oè ИЕН ЛЕН. 
零 假 设 Ho: нр рә = … 二 п 就 等 价 于 H: a; =0,7=1,2,.…,a, 或 Ho: р =y, =1,2, 
,a .假如 Fo 成立 ,a 个 水 平 所 对 应 的 总 体 都 应 服从 同一 正 态 分 布 ( 即 有 相同 的 均值 与 方 
э). 这 种 情况 下 , 仅 有 一 个 总 体 ( 即 所 有 处 理 从 统计 学 角度 来 看 都 应 是 同一 的 ); 换 名 话说, 处 
理 间 没有 显著 性 差异 . 


变 差 的 数学 期 户 
从 习题 16.10 可 知 , Vy, Vg, V 的 数学 期 望 如 下 ; 
E(Vy) =a(b ~ 1)о? (16) 
Е(У») =(a – 1)о2 + Б ўа; (17) 
ЕСУ) =(ab – 1)о? + b 2а, (18) 


从 式 (16) 可 知 


Е Уи) (19) 


因此 无 论 H, 成 立 与 否 
A2 o Vw 
Sw = alb — 1) 
都 是 参数 c 的 一 个 最 优 (无 偏 ) 估 计 . 另 一 方面 ,从 等 式 (16), (18) 可 推断 出 , 仅 当 Ho 成 立 ( 即 
а, =0) 时 , 才 有 


(20) 




















Vp | 2 V | 2 
E| A = о Е|—У—}| =, (21) 
因此 仅 当 Ho 成 立时 
2 Vp 2 М 
5в = _1 S = (22) 
Д о? 的 无 偏 估 计 . 若 H 不 成 立 , 从 等 式 (17) 可 知 
Е(5%) = + 2 1209 (23) 


此 时 52 不 是 o? ВАР. 

变 差 的 分 布 
利用 y? 分布 的 附加 性 质 ,我们 能 证 明 下 面 有 关 Vy, Vo V 分 布 的 重要 定理 
定理 1 уа -1)) 


+- м аа V 
定理 2 ЖН, 成 立 , 则 -过 一 y2(a -1),—у*(аё - 1). 


2 
С 


Ж 无 论 Ho 成 立 与 否定 理 1 都 成 立 , 而 定理 2 只 有 当 НУР. 
等 均值 零 假 设 的 下 检验 


EFRR Ho 不 成 立 ( 即 各 个 处 理 的 均值 不 全 等 ), 从 等 式 (23) 我 们 能 看 出 ， 52 总 比 o2 要 
KÈ, 且 均 值 间 的 差异 越 大 , 效应 就 变 得 越 明显 ; 另 一 方面 ,从 等 式 (19), (20) 能 看 出 ,无 论 均值 
_ ^2 
из, S% 都 可 看 作 与 o* 是 等 加 的 ,因此 就 得 到 检验 Ho 的 一 个 很 好 的 统计 量 闻 .着 这 个 
W 
统计 基 明 显 偏 大 , 我 们 即 可 推断 , 各 个 处 理 均值 之 间 有 明显 差异 , 因此 拒绝 H: 否则 接受 Ho, 
短 作 进一步 分 析 . 
_ S? 
为 TEAS, 我 们 必须 了 解 它 的 抽样 分 布 . 
W г: 
定理 3 统计 量 P= ~F(a-1,a(b -1)). 
у 
ЖЛ 3 使 我 们 能 在 某 给 定 显著 性 水 平 下 , 运用 FATAR RARE Ho( 见 第 
十 一 章 ). 
方差 分 析 表 
上 述 检验 的 计算 见 表 16.2, 这 样 的 表 称 为 方差 分 析 表 . 实际 上 ， 我 们 可 通过 (3) 或 (8) 的 长 
方法 计算 V 和 Vs, 也 可 用 (10) 或 (11) 的 短 方法 来 计算 ， 然后 利用 Vw = У – Vs HA vy. H 
Ж, ЛАНА Ш (ар - 1) 等 于 组 内 变 差 与 组 间 变 差 的 自由 度 之 和 


{Н ЇН] 3 а -1 
Vg = #2у(Х,. -XF 





М2 
Sp 


Sw 


组 内 变 差 人 (56-1)| gz Vw | 服从 自由 度 a -la(5-1) 的 下 分 布 
Vw = У – У, а(5Ь—1) | 
EFA Н 
V= VetVw= > (Xi -XF 
„Ё а Е 


观测 值 数目 不 等 时 所 做 的 修正 


假如 处 理 1, 处 理 2……, 处 理 a 所 对 应 的 样本 容量 不 同 ,分 别 为 Nj, N;,…, №,, 上述 结 
论 应 被 修正 : 





— 2 
V=5 X-X? = уух - 1 (24) 
Jk 3. Ё “ 
— 2 x — 42 Т?. Т? 
Vs = 210, - Х)? = У(Х. -X= Уу у-у (25) 
j.k 1 ) J 


其 中 2). 表示 j 不 变 , 对 和 从 1 №, 求 和 ,然后 再 对 ; 从 1 到 a 求 和 . 表 16.3 就 是 这 种 情 
帝 下 的 方差 分 析 表 . 





Ф 16.3 
组 间 变 差 a-i `2 _ Мв 
— 一 Sa = 1 ^2 
Vs = DUN,(X,. – Х) Эв 
; o 5% 
ARFA N-a $2, = V 服从 自由 度 为 a- 1, N - a 的 下 分 布 
Vw = V-V, N-a 
总 变 差 N-1 


V= Vst Vw= D(X -XP | 
‚Ё 


双 回 分 类 或 双 因素 试验 

单 因 素 方差 分 析 的 思想 可 被 推广 到 一 般 情况 . 例 2 怠 是 对 双 因 素 方差 分 析 思 想 的 一 个 一 
Ж. 

例 2 假设 一 个 农业 试验 的 目的 是 为 了 考察 四 种 不 同 品种 小 麦 的 亩 产量 ,将 每 一 品种 种 
ЕЕЗ 块 不 同 的 土壤 中 , 因此 共 需 4x5= 20 块 地 .这 种 情况 下 ， 各 把 几 个 小 块 合 并 成 一 个 区 


组 , 显然 有 利于 观察 .因此 我 们 把 种 植 不 同 品种 小 麦 的 4 个 小 块 合 并 成 一 个 区 组 , 这 样 就 需要 
5 个 区 组 . 


盏 产量 可 能 由 于 下 面 的 原因 而 形成 差异 :(1) 小 麦 品 种 不 同 或 (2) 区 组 的 不 同 .所 以 此 时 存 
在 着 两 个 因素 . 


由 例 2 的 实验 知 ， 我 们 通常 会 在 试验 中 遇 到 两 个 因素 ;处理 和 区 组 . 一 般 简 称 为 因素 1 和 
因素 2. 


双 因 素 试 验 的 记号 表示 
假设 有 a 个 处 理 ,2 个 区 组 , 可 构造 表 16.4, 假设 其 中 的 每 个 符号 均 对 应 于 一 个 观测 什 . 


对 处 理 j 和 区 组 &, 可 用 X ERRE, X,.(j =1,2,…, a к j 行 数据 的 均值 , X , (k=1， 
2,…, 上 b) 表 示 第 k 列 数据 的 均值 , X 表示 总 均值 , ВП 

У z le z_ 1 

X. = T D Xw Xa= УХ, Х = УХ (27) 





双 因 素 试 验 的 变 差 
如 同 单 因素 试验 一 样 , 我们 可 定义 双 因 素 试验 的 变 差 .总 变 差 ( 如 (3) 式 ) 
V= > (X, -XY (28) 
对 Xp — X 进行 拆 分 
Х„-Х=(Х„-Х,-Х„+Х)+(Х,-Х)+(Х,-Х) (29) 
然后 平方 ,并 对 7),& 求 和 , 则 


V = Vet Ур + V} (30) 
其 中 
VE = 随机 变 差 = >X (Xa 一 Хх, 一 X., + Х)? 
Ук = 处 理 间 变 差 = „У(Х. - Х)? 
Vc = 区 组 间 变 差 = a (X, -XX 
随机 变 差 也 称 为 残 差 或 随机 变 差 . 
对 应 于 (10), (11), (12) 式 ,我 们 也 可 得 到 计算 V, Ук, Ve, Ve 的 快捷 方法 . 
У = УХ – T (31) 
a 2 
Ук ->D T -2 (32) 
b 2 
ус = D Tha- E (33) 
Ve = V – VR - Ve (34) 
其 中 
T = Ху, D = ЭХ, Tr= D Xa 
双 因 素 方 差分 析 
将 (15) 式 所 给 出 的 单 因素 方差 分 析 的 数学 模型 进行 推广 , 可 得 到 双 因素 试验 的 数学 模型 


X k = и + а; + В, + Ek (35) 
其 中 25а, = 0, 2)B =0.p 表 示 总 体 总 均值 , a, 是 对 应 X, 中 处 理 差异 的 部 分 (有 时 也 称 为 处 


理 效应 ), В, 是 对 应 Xx 中 区 组 差异 的 部 分 (有 时 也 称 为 区 组 效应 ). ex 是 对 应 Xx 中 随机 误差 的 
部 分 , 如 前 所 述 ,假定 ex 服从 均值 为 0, 方差 为 o? 的 正 态 分 布 , 则 Xx 服 从 均值 为 w+ а, + В, 
方差 为 o 的 正 态 分 布 . 

对 应 于 (16), (17), (18) 式 , 可 证 明 上 述 变 差 的 数学 期 望 


Е(У;) = (а —1)(Ь—1)в? (36) 

E( Vg) = (а – 1)02 + Б ўа; (37) 

Е(Ус) = (Б ~ 1)с?+а 218 (38) 

Е(У) = (ab – 1)0° +b уа? + а УЙ? (39) 
需要 检验 如 下 两 个 零 假设 ， | | 


Ho :所 有 处 理 均值 相等 , 即 а =0,j =1,2,…,a. 
Ho :所 有 区 组 均值 相等 , 即 р, =0,6=1,2,---, Б. 
从 (36) 式 可 看 出 ,E(St)=o?, 因 此 不 管 假设 HP, H? 成 立 与 否 , 02 都 有 一 个 无 偏 估计 











a Ve 
SE = (тукт) чо) 
若 假设 HP, HO 成 立 , 则 
“> _ VR “2 Vc “2 V 
Sk = ср Sc = р-р S = b-i (41) 
EIK о? 的 无 偏 估 计 . 若 假设 НО, HO 不 成 立 , 从 (37), (38) 式 可 看 出 ， 
ECS) =0 + 2 Уе! (42) 
E(S2) =0? + ; = ү 208 (43) 


下 面 定 理 与 定理 1 和 定理 2 类 似 . 
ү 
定理 4 2 (ба -1)(5 一 1)), Н, H? 成 立 与 否 都 适用 。 


4 a mY чө: a mY 
定理 5 车 Ho ЖЗ, —у°(а—1).Я# Н? RE, 1 gO -1). 若 HP, НО 
с 


BRE, W~ lab -1). 


“2 
要 检验 HP, аен и ЕЕ, 因为 从 (42) 式 可 看 出 , 如 果 处 理 均 值 差异 显著 , 则 
Е 


м2 ^2 
DR SC 


_ м2 
52 5o 间 的 差异 也 应 该 显著 ; 同 理 , 为 了 要 检验 н, йын ис SE 二 的 分 布 见 
» Е : 
定理 6( 如 同 定 理 3). ИЕ 
Ж М ‚52 
定理 6 НУ RE, 则 统计 量 s2 ~ F(a -1,(a 一 1)(5 一 1)). 车 Н? 成立, 旭 统 计量 
Е 
52 ` 


5с 
со 7 Ё(5—1,(а-1)(Ь—-1)). 
Е 


由 定理 6, 我 们 可 在 给 定 显著 性 水 平 下 , 接受 或 拒绝 НО 或 HO. 为 了 计算 方便 , 可 仿照 
单 因素 方差 分 析 , 得 到 双 因 素 方差 分 析 的 方差 分 析 表 ( 见 表 16.5). 


ара _ . V 52 
АЬР [а] ЗЕ 22 Н а - 1 SR = 一 FÈ F(a-1(a -1X6 =- 1) 
Vr = Ь (X, -XY | 
1 








Н [8] 3 б ~ 1 52 
区 组 间 变 差 Кон 站 ~- FO- ia- 00-10) 
Ус = аУ(Х,- X? Ё 
È 
mm . (a -De -|, _ Vg 
Veo V-V- v. D Е -DGI 
总 变 关 ab-ı 


有 重复 的 双 因 素 试 验 


在 表 16.4 中 , 相对 于 给 定 的 处 理 与 区 组 , 仅 收集 了 一 个 观测 值 . 因 素 的 更 多 信息 经 常 通过 
重复 试验 得 到 , 即 称 为 有 重复 的 试验 .此 时 , 对 应 于 给 定 处 理 与 区 组 ,将 有 多 个 观测 值 . 假设 对 
应 于 每 个 处 理 与 区 组 有 с 个 观测 值 ; 当 重 复 个 数 不 等 时 , 可 做 适当 的 调整 .由 于 出 现 了 重复 , 模 
型 (35) 必 须 做 以 下 修正 

Хы = къа + В + Ур + en (44) 

Хы Ку, А, DIRETE; 个 处 理 ,第 个 区 组 ,第 1 次 重复 .在 (44) 式 中 ， р, а,, Be 如 

前 所 定义 ,ei 表示 随机 误差 , yi, 表示 行 - 列 (或 处 理 -区 组 ) 的 交互 效应 , 通常 简称 为 交互 . 它们 
之 间 的 限制 如 下 


Хау = = 0 228, = = 0 А = = 0 22у = = 0 (45) 


并 假定 х ,服从 均值 为 十 @, + В, + ©» 方差 为 б 2 的 正 态 分 布 
如 前 所 示 ,总 变 差 可 以 分 解 为 处 理 间 变 差 Va, 区 组 间 变 差 Vo 交互 变 差 ү 和 残 差 Vi : 


V= Vekt Vect Vi +V; (46) 
其 中 
V=) (Xu -XY (47) 
Jj kil 
Ve = bc OX,.. 一 XxX) (48) 
Ү. =ac X) (Xa -XY (49) 
Vi =c) (Xn -Х, -Х„ +х)? (50) 
VE = 2 (Xn 一 Xa Y (51) 
上 述 各 式 中 , 下 标的 点 表示 对 相应 的 下 标 已 被 求 和 . "п 
1 
Х, = be Xm = 5 6 УХ, (52) 


ЗЕЧЕВИ НЕОГУРИ: ЖЭН Н ЕШ ВЕН ЕП, 则 可 建立 表 16 6 的 方差 分 析 表 ， 
表 的 最 后 一 列 可 用 来 检验 零 假设 : 
Ho” :所 有 处 理 均值 相等 , 即 a, =0. 


HE? ;所 有 区 组 均值 相等 , 即 В, =0. 
HE ,处理 与 区 组 间 无 交互 作用 , 即 У» = 0. 


и у S? 
处 理 闻 变 差 Vp а—1 S} = — j 





П a 7 Ё(а-1,аб(с<1)) 
a Е 
、 V 2. 

区 组 间 变 差 Ve bp-1 St = 六 2 РОБ 1, able -1)) 
Е 





7 яу : — Мр 51 _ — 一 Ь(с—1 
交互 变 差 Wi (а-1)(Ф-1) SI ТШТУ D 52 Е((а = 1)(6- 1), а5(с-1)) 


2- VE 
R Ve ablc— 1) E ap(c—1) 


$2 
A АПИ АЖА, 在 给 定 显著 性 水 平 下 ， 应 首先 利用 统计 其 53; 判断 是 否 拒绝 HE? .此 时 
E 
可 能 存在 两 个 问题 ; 
52 S2. 
1. 不 能 拒绝 НО .此 时 可 认为 交互 作用 不 是 很 大 . 因此 ,可 以 通过 统计 其 2 和 =z 来 检验 
E E 


HP, н. 有 些 统计 学 家 认为 此 时 可 合并 Vj 和 Vj 得 到 均 方 
(Vi + Veila = 1)(6 -1)+ab(c -1)] 

然后 利用 它 来 蔡 换 F 检验 中 的 52. 

2. 拒绝 He .此 时 知 交互 作用 非常 显著 . 仅 当 因素 的 差异 比 起 交互 作用 来 说 很 大 时 才 可 

S2 S2 | 

“为 因素 的 差异 具有 重要 性 , 因此 ,许多 统计 学 家 认为 用 < 和 这 来 检验 HP, Н? 比 用 表 
16.6 提供 的 统计 量 要 好 些 .我 们 也 采用 这 种 统计 量 . 

重复 试验 下 的 方差 分 析 , 可 通过 将 同一 个 理 ( 行 ) 与 区 组 ( 列 ) 下 的 重复 观测 值 汇总 成 一 
个 观测 值 , 得 到 一 个 在 各 个 处 理 与 区 组 下 都 只 有 一 个 观测 值 的 双 因素 方差 分 析 表 ， 如 表 16.5. 
由 习题 16.13 可 看 到 具体 的 操作 过 程 . 


实验 设计 


上 述 方差 分 析 的 方法 是 在 试验 的 基础 上 获得 的 为 了 得 到 尽 可 能 多 的 信息 ,试验 设计 必须 
提前 认真 进行 , 这 就 是 我 们 经 常 提 到 的 实验 设计 . 下 面 是 实验 设计 的 几 个 重要 例子 : 

1. 完全 随机 化 .假设 我 们 有 一 个 如 例 荆 所 示 的 农业 试验 ， 为 了 设计 此 试验 , 可 把 一 块 地 分 
为 4X4=16 个 小 块 ( 如 图 16-1 所 示 的 正方 形 ， 实际 上 可 以 是 任意 形状 ), 每 个 处 理 ( 用 А,В, 
С.р 表示 ) 分 配 到 完全 随机 选择 的 4 个 区 组 中 .随机 化 的 目 的 是 为 了 减少 各 种 误差 源 , 例如 土 
壤 的 肥沃 度 . 





л B ы m= 





完全 随机 化 随机 化 区 组 
图 16-1 图 16-2 
2. 随机 化 区 组 .如 同 例 2 所 示 , 对 每 一 区 组 都 必须 有 处 理 的 完全 集 . 对 于 每 一 个 区 组 (用 
LII NVF), ЗНА A,B,C,D, 因此 区 组 称 为 随机 化 区 组 .这 样 设计 的 目的 是 
为 了 控制 单 源 误差 , 即 区 组 间 的 差异 . 
3. 拉丁 方 .有 时 需 同时 控制 双 源 误差 ,例如 行 间 和 列 间 差异 例如 在 例 1 的 试验 中 , 不 同行 
个 同 列 间 的 误差 可 能 是 由 于 土壤 不 同 处 的 肥沃 度 不 同 而 造成 的 . 此 时 各 行 名 列 同一 外 理 休 出 


现 一 次 显然 较 好 ,如 图 16-3. 因 为 这 种 设计 用 到 拉丁 字母 4A,B,C,D, 所 以 称 为 拉丁 方 . 





希腊 -拉丁 方 
图 16-4 





4. 和 希腊 -拉丁 方 .假如 想 控 制 三 源 误 差 ,就 要 用 到 图 16-4 的 希腊 -拉丁 方 , 它 相当 于 两 个 拉 
丁 亡 的 全 加 ,一 个 用 拉丁 字母 A, В,С, D, 另 一 个 用 希腊 字母 a, В, y, 8 . 它 要求 每 个 拉丁 字母 
和 每 个 希腊 字母 只 能 同时 出 现 一 次 .这 种 正方 形 称 为 正 交 的 . 


习题 及 解答 
单 向 分 类 或 单 因 素 试 验 
16.1 WEH V= Vy+ V}, Вр, 
2 (Xn - XY 一 2 (Xp - X, )? + у(х, - X} 
2. Ё >. Ё 3. Ё 
Ж Бе 已 知 
Xa- X= (Хь - Х,) + (х, - Х) 
平方 再 对 j,k RA, W 
>) (Xa XPD Xg -X + УХ -х)? 


+25, (X — Х,)(Х, - X) 
下 面 证 明 上 式 最 后 一 项 为 0， | 


因为 
—. 1 b 
X, = ХХА 
k= 


16.2 用 本 章 (1), (2), (13) 式 的 记号 , 验证 (a) 工 = ab X,(b)T, =bX,, (с) ХТ, = аХ. 


Ж EF (а) 





T= УХ, = а 26 УХ. = abX 
(Ь) 
Т, = эх, = TEDA = bX, 
(9 因为 了 .= D Xa 由 (9) 知 
УТ, = УУХ, = Т = Хх 
16.3 证 明 本 章 的 快捷 公式 (10), (11) (12). 
证明 gp 


—_ МЛ DETE _ 、 рун T 
V = (Xn X) = 200 -2ХХ„ + X?) 


16.4 


= УУХ» -2X >)Х„ + аХ? = ох» - 2Х(аЬХ) + а&Х? 
了 天 Г 


同 理 
Vp = УМХ -XP = > (X -2X- X + Х?) 
Jk 


1 


5 T pye 元 Т, 2 ч Т,. ұ2 
= Х),-2Х2,Х, + abX? = У Т] -XD | 26) + а 


pk o` 


a 由 а 
=> S, T? -2X(abX) + abX? = EST? - ах? 
:=1 


H V= Vw+ Уһ, 8 
现 有 一 经 过 化 学 药品 А,В,С 处 理 过 的 特定 类 型 的 土壤 , R 16.7 表示 种 植 在 其 上 的 
某 品 种 小 麦 的 亩 产量 (单位 ;蒲式耳 ) .利用 公式 (7) 和 (8), 计 算 . 

(а) 名 个 处 理 的 均值 , (b) 总 均值 , (c) 总 变 差 ,(d) 组 间 变 差 , (e) 组 内 变 差 , ({) 给 出 表 
16.7 数据 的 Minitab 分 析 , 并 指出 (a) 到 (e) 的 输出 结果 . 


表 16.7 





解 E 为 了 简化 计算 , 可 以 从 表 16.7 的 数据 中 均 减 去 一 个 适当 的 数 ,例如 45, 这 样 做 并 不 影响 变 
差 值 , 从 而 得 到 表 16.8. 


表 16.8 
3 4 5 4 
2 4 3 3 
4 6 5 5 


(а) Ж 16.8 的 处 理 均值 分 别 为 


X = 1(3+4+5+4) = 4, 
Х,. =- 才 (2+4+3+3) = 3, 
Х,. =1(4+6+5+5) = 5 


因此 ,通过 加 45, 即 可 得 A,B,C 三 种 处 理 的 平均 产量 , 分 别 为 49,48, 50 蒲式耳 /英亩 . 
(b) 总 均值 为 


Х= 巧 3+4+5+4+2+4+3+3+4+6+5+45) =4 


因此 表 16.7 所 示 数 据 的 总 均值 为 44$+4= 49 蒲式耳 / 英 席 . 
(с) 总 变 差 为 


V = (Xn X) = (3 – 4)? + (4-4) + (5 – 4)2 + (4-4) + (2-4)? 


+ (4-4) + (3 – 4)? + (3 – 4)2 + (4 – 4) + (6-4)? 
+ (5 – 4)? + (5 – 4)2 = 14 


16.5 


(а) 组 间 变 差 为 
Vp = БУХ 


= Х)? = 4[(4-4)?°+(3-4)?°+ (5 ~ 4)2] = 8 
(е) 组 内 变 差 为 

Vw=Vr-Ve=l4-8=6 
э 


Vw = X (Xp -X,Y = (3 4)2 + (4 – 4)2 + (5 – 4)2 + (4 – 4)2 + (2-3)? 


+ (4 – 3)? + (3 3)? + (3 – 3)2 + (4 – 5)2 + (6 ~ 5) 
+ (5 – 5)? + (5 ~ 5)? = 
Ж 表 16.9 是 习题 16.4,16.$,16.6 的 方差 分 析 表 . 





表 16.9 
т # __ 由 度 | B 方 | F 
组 间 变 差 а-1= 2 55 = 2-=4 , 
Ур = 8 Эв_ 4 e 
i | 52, 2/3 
ане 73X359 4-6,2 | RAAHEN 2 ot ЕЙ 
Vw=V- Vp=14-8=6 | 
总 变 差 ab-1=3x4-1=11 
V=14 
(0 Minitab 计算 结果 如 下 . 表 16.7 的 数据 输 到 工作 表 的 3 列 中 ,各 列 分 别 记 为 A, В,С. 
MTB > AOVOneway ‘А’ ‘В’ ‘C’. 
One-way Analysis of Variance 
Analysis of Variance 
Source DF SS MS F P 
Factor 2 8.000 4.000 6.00 0.022 
Error 9 6.000 0.667 
Total 11 14.000 
Individual 95% CIs For Mean 
Based on Pooled StDev 
Level N Mean StDev 一 一 一 -一 一 二 一 一 一 一 一 二 一 一 一 一 一 二 一 一 一 一 一 
A 4 49.000 0.816 (=== - = < 一 一 一 一 ) 
B 4 48.000 0.816 (-----*----- ) 
C 4 50.000 0.816 (一 一 一 一 一 一 一 一 一 一 ) 
一 一 一 一 一 一 += 
Pooled StDev = 0.816 48.0 49.2 50.4 


从 Minitab 输出 可 看 出 ,3 个 处 理 均值 分 别 为 :49 ,48 Ж 50, 与 (a) 中 的 结论 一 致 ;(c) 的 总 变 差 了 = 14 
对 应 于 Minitab 输出 中 单 因素 方差 分 析 表 的 Total 55 = 14; (d) 的 结论 Ув = 8, 对 应 于 Factor SS= 8; 
(e) 的 结论 Vw = 6 对 应 于 Error SS= 6. Minitab 也 提供 了 数据 的 点 图 与 箱 形 图 , 见 图 16.5、 图 16.6. 
对 于 习题 16.4, 试 寻找 一 个 总 体 方差 с? 的 无 偏 估计 . 

(a) 在 零 假 设 成 立时 ( 即 各 处 理 均值 相等 的 条 件 下 )， 利用 组 间 变 差 . 

(b) 利用 组 内 变 差 . 

(c) 参考 习题 16.4 解 的 Minitab 输出 ,指出 对 应 于 (a)， (b) 的 方差 估计 . 

Ж F(a) 





a V 
2 „В 8 
Ўв = 1 3 – 1 


= 4 
(Ь) 


Vw 6 2 


Sw = рр 30-73 | 
(с) 方差 估计 S} 和 Minitab 输出 中 因素 均 方 一 致 , 即 Factor М5 = 4.000; 7% fiit 52, 和 Minitab $ 
出 中 误差 均 方 一 致 , 即 Error MS= 0.667. 








А В C 


K 16-5 A-C 点 图 (组 均值 用 直线 表示 ). 





A B C 


图 16-6 A-C 箱 形 图 (均值 用 实心 点 表示 )， 


16.6 见习 题 16.4, 看 是 否 能 在 如 下 的 显著 性 水 平 (a) 0.05, (Ь) 0.01 下 ,拒绝 原 假 设 ( 即 处 
理 均 值 相 等 )? (с) 参考 习题 16.4 解 的 Minitab 输出 ， 检验 零 假设 是 否 成 立 ? 


解 F 已 知 


НН ЖУ а-1=3—1=2,Жа(®-1)=3(4-1)=9. 
(a) 由 附录 V , 可 查 得 Е„„(2,9)=4.26, 17 F=6> Fo о, HHE TEKE 0.05 F, 拒绝 零 假 设 , 即 处 
理 间 均值 不 等 . 
(b) HERV, 可 查 得 Fi (2,9)=8.02, 而 下 =6< Fu9， 因 此 可 在 水 平 0.01 下 ,不 能 拒绝 零 假设 ， 
即 处 理 间 均值 相等 . 
(с) 由 习题 16.4 解 的 Minitab 输出, 可知 下 值 为 6. 产值 为 0.022, 即 拒绝 零 假 设 的 最 小 显著 性 水 平 
应 为 0.022, 因此 当 显 著 性 水 平 为 0.05 时 ,拒绝 零 假设 ;但 水 平 为 0.01 时 ,不 能 拒绝 零 假 设 . 

16.7 利用 公式 (10), (11) 和 (12) 求 解 习 题 16 4 


解 ке 把 表 16.8 的 数据 重新 安排 即 可 得 到 袁 16. 10. 


16.8 





(а) 利用 公式 (10), 可 得 








УХ» = 9+16+25+16+4+16+9+9+ 16 +36 +25 + 25 = 206 
J.k 


H 


=3+4+5+4+2+4+3+3+4+6 +5 + 5 – 48 


因此 


(b) 各 行 之 和 为 





Ti, =3+4+5+4=16,Т, =2+4+3+3-=12,T, 
且 
T = 16 + 12 + 20 = 48 
利用 公式 (11), 可 知 
-了 2 Z 1 2 2、 48? 
Ув = 6 2073 и = 4016 + 127 + 20°) 5х4 
(с) 利用 公式 (12), 可 知 
Vw=Vvr-yva=14-8= 


此 结论 和 习题 16.4 的 结论 一 - 致 . 


Ж Н] Ж НЕЛЯ А, B,C, D,E 中 购买 一 台 机 器 、 为 此 ,设计 了 一 个 试验 来 检验 
机 颖 性 能 方面 是 否 存在 差异 .5 个 熟练 工人 分 别 在 每 种 机 器 上 操作 相同 时 间 . 表 16.11 
展示 了 每 台 机 器 生产 的 产品 数 . 在 显著 性 水 平 (a)0.05, (Ь)0.01 下 检验 假设 :机 器 间 不 
存在 差别 . (с) 给 出 此 问题 的 Minitab 解 , 并 利用 轧 值 方法 检验 假设 :机 器 间 不 存在 差 


Ж. 


А 
В 
C 
D 
E 


表 16.11 
68 72 77 42 
72 53 63 53 
60 82 64 75 
48 61 57 64 
64 65 70 68 


206 - 192 = 14 


=4+6+5 +5 = 20 


= 200 – 192 = 8 





解 kB 为 了 简化 计算 , 可 以 从 表 16.11 的 数据 中 均 减 去 一 个 适当 的 数 ,例如 60, 从 而 得 到 表 








16.12. 
54? _ 
V =2658 – = 2658 - 116.64 = 2541.36 
5x5 
_ 3874 542 А _ 
Vp = — с = 774.8 — 116.64 = 658.16 


由 此 得 到 表 16.13, 查 表 知 Е, (4,20) =2.87, 因 此 不 能 在 水 平 0.05 下 拒绝 零 假 设 , 当然 水 平 
0.01 下 更 不 能 拒绝 零 假设 . 









组 间 变 差 
Vp = 658.2 







Vw = 1883.2 


У= 2514.4 










把 每 台 机 器 的 产量 作为 一 列 输入 到 Minitab 工作 表 中 ,共有 5 列 , 用 命令 AOVOneway ‘A’‘B’ 
‘C'D ‘E, 可 得 到 如 下 输出 
MTB > AOVOneway ‘А’ ‘B’ ‘С’ ‘р’ Е’ 
One-way Analysis of Variance 


Analysis of Variance 


Source DF SS MS F P 
Factor 4 658.0 164.5 1.75 0.179 
Error 20 1883.2 94.2 
Total 24 2541.4 


Individual 95% CIs For Mean 
Based on Pooled StDev 


Level ’' N Mean StDev ----+--------- +--------- +”-------- +-- 

A 5 62.400 14.502 (-------- *~------- ) 

В 5 57.800 9.628 (-------- б-------- ) 

C 5 70.600 8.764 (-------- *-------- ) 

D 5 56.000 6.892 (-------- *-------- ) 

E 5 64.000 6.595 (—-------*#-------- ) 

n aa +--чо- --—--- +7----.--- +-- 

Pooled StDev = 9.704 50 60 70 80 
产值 为 0.179, 即 零 假 设 被 拒绝 的 最 小 显著 性 水 平 为 0.179. 因 此 , 在 水 平 0.01 或 0.05 下 , 零 假 设 均 
不 会 被 拒绝 . 

观测 值 数 目 不 等 时 所 作 的 修正 


16.9 表 16.14 是 某 公司 生产 的 三 种 型 号 的 电子 管 的 寿命 (单位 ;小 时 ) .用 (3), (8) 式 的 长 方 
法 ,在 显著 性 水 平 (a)0.05, (b)0.01 下 判断 三 种 电子 管 之 间 是 否 存 在 差异 ? 


Æ 16.14 
OOOO 
样本 1 407 411 409 
样本 2 404 406 408 405 402 
样本 3 410 408 406 408 


E EF 从 表 16.14 的 数据 中 均 减 去 400, 得 到 表 16.15, 此 表 列 出 了 行 总 和 , 样本 均值 ， 总 均值 . 


V=X\ XXP = (7 - 7) + (11 - 7) ++ (8-7)? = 72 


=3(9 – 7)2 + 5(7 – 5)? + 4(8 – 7)? = 36 
Vw =V – Va = 72 – 36 = 36 
也 可 直接 计算 Vy 
Vw =(7-9)*°+(11-9)?+(9—9)2+(4—-5)2+(6— 5)2 + (8 – 5)2 
+ (5 - 5)? + (2 – 5)2 + (10 - 8)? + (8 – 8)2 + (6 – 8)2 + (8—8)? = 36 


表 16.15 





2 16.16 为 上 述 数 据 的 方差 分 析 表 . 由 附录 V 可 查 得 Еџ.95 (2,9) = 4. 26, 由 附录 要 可 可 得 
Ес. 502,9) = 8.02, 因 此 可 在 水 平 0.05 下 拒绝 零 假设 ;样本 间 均 值 相等 ( 即 认 为 三 种 电子 管 间 有 差 
异 ), 但 当 水 平 为 0.01 时 ,不 能 拒 络 零 假设 ( 即 认为 三 种 电子 管 间 无 差异 ). 





16.10 ”用 快捷 方法 (24), (25), (26) 式 求解 习题 16 .9 


Ш EF 从 表 16.15, 可 知 N; =3, N = 5， N3=4, N=12, T1. =27, Т,. = 25, T3. =32, T = 84, 因 此 


Vw =V- Ур = 36 
方差 分 析 过 程 与 习题 16.9 一 样 . 


双 因 素 方差 分 析 


16.11 表 16.17 表示 种 植 在 三 块 用 不 同 肥料 处 理 过 的 土壤 中 的 四 种 不 同 品种 庄稼 的 言 产量 . 


用 长 方法 ,在 显著 性 水 平 0.01 下 判断 亩 产量 是 否 (a) 由 于 施肥 的 不 同 ， (b) 由 于 庄稼 品 
种 的 不 同 而 存在 差异 ? (с) Н Minitab 求解 . 


Ж 16.17 


вв | 78 96 
59 | 68 | 57 











肥料 B 





# EE 计算 行 之 和 , 行 均值 , 列 之 和 , 列 均值 ,数据 总 和 ,总 均值 , 见 表 16.18. 
Ж 16.18 


Tos o o a 


























行 均值 与 总 均值 间 的 变 差 为 
Ук = 4[(6.2 – 6.8)? + (8.3— 6.8)*+{(5.9- 6.8)2] = 13.68 
列 均值 与 总 均值 间 的 变 差 为 
Ve = 3[(6.4—6.8)° + (7.0 – 6.8)? + (7.5-6.8)? + (6.3 — 6.8)2] = 2.82 
У =(4.5 – 6.8)? + (6.4-6.8)? + (7.2-6.8)? + (6.7-6.8)? 

+ (8.8 ~ 6.8)? + (7.8 – 6.8)? + (9.6 ~ 6.8)? + (7.0 — 6.8)2 + (5.9 – 6.8)? 

+ (6.8 – 6.8)? + (5.7 – 6.8)2 + (5.2-6.8)? = 23.08 
随机 变 差 

Ук = У- Vk- У. = 6.58 

表 16.19 为 方差 分 析 表 . 


2 
меша 2 | 82 =6.84 БЕ 6.24. АН 2,6 
$2. = 
Ус=2.82 ки 52=0.94 2 = 0.86, Н 93,6 


显著 性 水 平 为 0.05 时 , 查 表 知 Fu (2,6) = S.14. 由 于 5.14<6.24, 则 可 拒绝 行 均值 相等 的 候 
设 ,认为 在 水 平 0.05 F, 由 于 施肥 的 不 同 产量 间 存 在 着 显著 差异 。 

由 于 列 均值 所 对 应 的 Е 值 小 于 1, 可 认为 庄稼 品种 的 不 同 不 会 影响 调 产 量 . 
(ec) 首先 给 出 Minitab 工作 表 的 数据 结构 , 然后 给 出 双 因 素 的 Minitab ЭЧ. 


Row Crop Fertilizer Yield 
1 1 1 4.5 
2 1 2 8.8 
3 1 3 5.9 
4 2 1 6.4 
5 2 2 7.8 
6 2 3 6.8 
7 3 1 7.2 
8 3 2 9.6 
9 3 3 5.7 
10 4 1 6.7 
11 4 2 7.0 
12 4 3 5.2 


MTB>Twoway ‘Yield? ‘Crop’ “Fertilizer ; 


SUBC > Means ‘Crop’ ‘Fertilizer’. 


Two-way Analysis of Variance 


Analysis of Variance For Yield 


Source DF SS MS F P 
Crop 3 2.82 0.94 0.86 0.512 
Fertiliz 2 13.68 6.84 6.24 0.034 
Error 6 6.58 1.10 
Total 11 23.08 
Individual 95% CI 
Crop Mean --+-- - - - - - - - +ж-------- - 十 ~ 一 ~ 一 ~ 一 ~ 一 ~ фе --- 5 - 
1 6.40 (-—------------- а ---- ) 
2 7.00 (---------—----- Ж ) 
3 7.50 (-------------- A- ) 
4 6.30 (-—------------- жа - ) 
~“-+----~----- фт фет --- 0-0-0 +~-~-~--~-- 
5.00 6.00 7.00 8.00 
Individual 95% CI 
Fertiliz Mean --+--------- +71- ------ +77-=7-~--- t~emen 
1 6.20 (---------- 二 一 ~ 一 ~ 一 ~ 一 -- ) 
2 8.30 (=------ -- - - k w e e ==- ) 
3 5.90 (-—---------- ж... ) 
--+-------- - +2 ------- - +-~-~~~-~~-~ +~-~-~---- 
4.80 6.00 7.20 8.40 


工作 表 中 的 数据 结构 必须 与 表 16.17 中 的 数据 保持 一 致 .第 一 行 1， 1,4.5, 对 应 于 庄稼 了 ,肥料 
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1 下 的 产量 4.5; 第 二 行 1,2,8.8, 对 应 于 庄稼 了 ,肥料 2 下 的 产量 8.8. 以 下 同 理 .运用 统计 软件 最 常 
犯 的 一 个 错误 是 误 建 数据 结构 ,因此 一 定 要 保证 工作 表 中 的 数据 和 表 16.17 中 的 数据 一 致 .我 们 还 
注意 到 Minitab 的 双 因 素 方差 分 析 包 含 了 表 16. 19 相同 的 信息 . Minitab 输出 给 出 的 pp 值 允许 观测 
ЖАНЕР 分 布 表 ,就 可 对 假设 进行 检验 .庄稼 所 对 应 的 pp 值 为 0.512. 它 是 由 于 庄稼 品种 不 同 因 
而 拒绝 产量 间 存 在 差异 的 最 小 显著 性 水 平 ,4 品种 庄稼 的 产量 在 水 平 0.05, 0.01 下 都 没有 显著 的 差 
寞 .肥料 因素 所 对 应 的 p- 值 为 0.034， 从 而 我 们 得 到 结论 ;三 种 施肥 下 的 亩 产量 在 水 平 0.05 FHE 
著 差 异 , 在 水 平 0.01 下 差异 不 显著 . 

从 Minitab 输出 中 四 种 庄稼 产量 的 置信 区 间 可 以 断定 :庄稼 品种 不 同 并 不 影响 产量 , 而 三 种 肥 
料 的 置信 区 间 又 表明 , 肥料 В 作用 下 的 产量 可 能 要 高 于 肥料 A,C 下 的 产量 . 


16.12 ”用 快捷 公式 计算 习题 16.11. 
R S 从 表 16.18 可 知 
ХХі = 4.52 + 6.4 +. + 5.22 = 577.96 
3. 
Т = 24.8 + 33.2 + 23.6 = 81.6 
D, T? = 24.82 + 33.22 + 23.62 = 2274.24 
У) Т2, = 19.22 + 21.02 + 22.52 + 18.92 = 1673.10 
因此 
2 
У = X, = 577.96 — 554.88 = 23.08 
J.k a 
174 = 1 уу _T 1 x 227 
R= ‚ ор = д X 2274.24 - 554.88 = 13.68 
1 T? 1 
V = 一 >T2 - ag = 3 X 1673.10 – 554.88 = 2.82 
Ve =V - Vk У = 23.08 ~ 13.68 — 2.82 = 6 58 
和 习题 16.11 得 到 结论 一 致 
有 重复 的 双 因 素 试验 


16.13 茶 广 商 希望 了 解 四 种 生产 螺栓 的 机 器 (A, В, С, D) 的 效率 , 为 此 设计 了 如 下 试验 ;在 


一 周 内 ,记录 两 个 班组 每 天 每 类 机 器 生产 的 次 品 数 .结论 见 表 16.20. 利 用 方差 分 析 的 
方法 ,在 显著 性 水 平 0.05 下 , 判断 (a) 机 套间 是 否 存 在 差异 ?” (b) 班组 间 是 否 存 在 差 
异 ? (с) 用 Minitab 进行 方差 分 析 , 并 用 p- 值 求解 (a) 与 (b). 





解 кє 数据 可 整理 成 表 16.21, 此 表 中 包含 有 两 个 主因 子 机 器 与 班组 .因为 有 两 个 班组 , 所 以 可 


认为 一 周 内 的 每 天 都 产生 了 一 次 重复 .因此 表 16.21 数据 的 总 变 差 为 


268° 
40 


表 16.21 


у= 62 +42 + 52 +... + 7 + 102 — = 1946 — 1795.6 = 150.4 


机 器 班组 星期 一 星期 二 星期 三 星期 四 星期 五 和 


1 6 4 5 5 4 24 

a | | 
2 5 7 4 6 8 30 
1 10 8 7 7 9 41 

s | | 
2 7 9 12 8 8 44 
1 7 5 6 5 9 32 

c | d 
2 9 7 5 4 6 31 
1 8 4 6 5 5 28 

р | | 
2 5 7 9 7 10 38 
和 S7 51 54 47 59 268 


为 了 对 两 个 主因 子 (机 器 与 班组 ) 进 行 分 析 , 仅 考虑 对 应 于 各 因子 从 星期 一 到 星期 五 的 数据 和 
例如 机 器 A 、 班 组 工 所 在 行 之 和 为 24, 其 他 数据 见 表 16.22, 它 是 一 个 无 重复 试验 数据 的 双 因 子 表 . 
K 16.22 的 总 变 差 称 为 子 总 变 差 ,用 vs 表示 





5 5 
5.6 = 65.6 


= 1861.2 — 179 
行 间 变 差 为 


列 间 变 差 为 


_ 125? 1432 _ 268? 
Ve= 20 + 20 40 


假如 从 子 总 变 差 Vs 中 减 去 行 及 列 间 变 差 Ve + Ve, 就 可 得 到 由 于 行列 的 交互 作用 而 产生 的 变 差 : 
Vi= Vs- Vg У. = 65.6 – 51.0- 8.1 = 6.5 
最 后 考虑 残 差 , 即 随机 变 差 (假设 一 周 各 天 之 间 并 无 差异 ), 可 以 通过 总 变 差 V 减 去 子 总 变 差 
得 到 , BI 


= 1803.7 — 1795.6 = 8.1 


Ve= У-(У„к+ Vet У = V- Ус = 150.4 – 65.6 = 84.8 
上 述 所 求 方差 见 表 16.23 的 方差 分 析 表 .此 表 也 给 出 每 种 变 差 的 自由 度 .因为 表 16.22 有 4 
行 ,所 以 行 个 变 差 的 自由 度 为 4-1=3; 而 两 列 的 列 间 变 差 的 自由 度 为 2-1=1. 为 了 得 到 交互 变 差 
的 自由 度 , 首先 考虑 表 16.22 的 输入 数据 的 个 数 , 此 例 中 为 8, 所 以 子 总 变 差 的 自由 度 为 8-1=7， 
其 中 包含 有 行 自由 度 3 及 列 自由 度 1, 剩余 的 (7- (3+1)=3) 即 为 交互 变 差 的 自由 度 , 原始 数据 表 
16.21 有 40 个 输入 数据 , 则 总 自由 度 为 40 一 1= 39. 因 此 , 残 差 的 自由 度 为 39-7=32. 


行 间 变 差 ( 机 器 》 А 
Уь= 51.0 
列 间 变 差 (班组 ) 








首先 判断 交互 作用 是 否 显著 . 查 表 并 通过 内 插 知 临界 值 Е, (3,32) = 2.90, 而 计算 的 下 值 为 
0.817, 故 交互 作用 不 显著 ,机 器 间 存 在 显著 差异 , 因为 计算 的 下 值 为 6.42 而 临界 值 Ев ug(3,32) = 
2.90. 班 组 的 临界 值 为 4.15, 而 计算 的 F 值 为 3.06, 因而 不 会 由 于 班组 的 不 同 而 引起 次 品 上 的 差 
Ж. 

Minitab 的 数据 结构 如 下 , 把 它 和 表 16.21 的 数据 进行 比较 ,看 看 他 们 是 如 何 匹 配 的 ? 


Row Machine Shift Defects 
1 1 1 6 
2 1 1 4 
3 1 1 5 
4 1 1 5 
5 1 1 4 
6 1 2 5 
7 1 2 7 
8 1 2 4 
9 1 2 6 
10 1 2 8 
11 2 1 10 
12 2 1 8 
13 2 1 7 
14 2 1 7 
15 2 1 9 
16 2 2 7 


© 


17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 10 
命令 MTB > Twoway'Defects” Machine’ ‘shift " 可 用 来 进行 双 因 素 分 析 . 交互 作用 的 р- ÉA 
0.494, 这 古 零 假设 被 拒绝 的 最 小 显著 性 水 平 .显然 在 班组 和 机 器 间 交 互 作用 不 大 .班组 的 p 值 为 
0.090, 大 于 0.050, 即 认为 两 个 班组 间 的 差异 不 显著 ;机 器 的 请 值 为 0.002, 在 显著 性 水 平 0.05 F, 
由 四 种 机 器 的 不 同 而 引起 的 次 品 数 有 显著 差异 . 
MTB >Twoway ‘Defects’? ‘Machine’ ‘shifts’ ; 
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Two-way Analysis of Variance 


Analysis of Variance for Variance 


Source DF SS MS F P 
Machine 3 51.00 17.00 6.42 0.002 
Shift 1 8.10 8.10 3.06 0.090 
Interaction 3 6.50 2.17 0.82 0.494 
Error 32 84.80 2.65 

Total 39 150. 40 


图 16-7 是 班组 和 机 器 的 交互 作用 图 .此 图 指出 机 器 和 班组 间 可 能 存在 的 交互 作用 .但 是 方差 





1 
2 机 器 >? 4 


图 16-7 交互 作用 图 一 一 次 品 数 均值 


16.14 


拉丁 方 


16.15 


分 析 表 却 告诉 我 们 二 者 之 间 交 互 作 用 不 显著 . 当 交 互 作 用 不 存在 时 ,班组 [和 班组 开 的 折线 图 应 该 
是 平行 的 .图 16-8 的 主 效 应 图 表明 机 器 1 在 试验 中 平均 次 品 数 最 少 ,机 器 2 最 多 ; 班组 卫 中 的 平均 
次 品 数 比 班 组 工 要 多 .但 方差 分 析 表 明 班 组 间 的 差异 并 不 显著 . 


机 器 班组 





8.6 


7.8 
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6.2 


5.4 


在 水 平 0.01 下 求解 习题 16.13. 
解 F 在 此 水 平 下 ,交互 作用 仍 不 显著 ,因此 可 进一步 研究 . 


因为 Fo 556(3,32)=4.47< 下 =6.42( 行 间 ), 可 认为 在 水 平 0.01 下 ,各 机 器 的 效率 不 相等 ， 
因为 Fo oo(1,32)=7.51> 下 =3.06( 列 间 ), 可 认为 在 水 平 0.01 下 ,班组 间 无 显著 差异 . 


某 农 民 想 检验 四 种 不 同 肥料 (A, В, С, D ) 对 小 麦 产量 的 影响 . 为 了 消除 土壤 肥沃 度 
变异 之 误差 源 , 他 设计 了 一 个 拉丁 方 , 见 表 16.24. 其 中 的 数字 表示 每 单位 面积 的 产量 
HRE) .应 用 方差 分 析 , 在 显著 性 水 平 (a) 0.05, (b) 0.01 下 判断 肥料 间 是 否 存 在 差 
Ж? (с) 给 出 此 拉丁 方 的 Minitab Ж. 





R S 首先 计算 各 行 各 列 之 和 , 见 表 16.25. 每 种 肥料 作用 下 的 总 产量 见 表 16.26. 总 变 差 . 行 间 
变 差 . 列 间 变 差 及 处 理 间 ( 即 肥料 间 ) 变 差 计算 方法 如 前 . 则 总 变 差 为 

V = 18° + 21? + 252 +... + 102 + 172 – 295 = 5769 — 5439.06 = 329.94 
行 间 变 差 为 


2 2 2 
75° ‚68825, 70 _295 - 5468.25- 5439.06 = 29.19 


列 间 变 差 为 
77? 742 732, 712 29 _ _ = 469 
Ve= ЛЛ t g t g = 5443.75 — 5439.06 = 4. 


处 理 间 变 差 为 


— -一 -一 一 -一 = —— 一 — ш — . 一 84.19 
Vp = 4 + 4 + Д + 16 5723.25 – 5439.06 = 2 


表 16.27 为 方差 分 析 表 . 


70? 48? 85? 92? 295? 
4 


列 , 4.69 0.79 
处 理 , 284.19 47.9 


(а) 因为 Fo os(3,6)=4.76, 可 在 水 平 0.05 F, 拒绝 行 均 值 相等 的 假设 , 即 认为 在 显著 性 水 平 0.05 
下 ,各 行 土壤 的 肥沃 度 有 所 差别 ， 

因为 列 的 下 值 小 于 1, 故 认为 各 列 土 壤 的 肥沃 度 没 有 差别 . 

因为 处 理 的 下 值 47.9>4.76, 故 认为 肥料 间 存 在 差异 . 
(b) 因为 Fo%(3,6)=9.78, 故 在 水 平 0.01 下 ,认为 各 行 (或 各 列 ) 土 壤 的 肥沃 度 之 间 没 有 差异 , 肥 
料 间 存在 差异 . 
(с) 首先 给 出 Minitab 工作 表 的 数据 结构 文件 . 


Row Rows Columns Treatment Yield 
1 1 1 1 18 
2 1 2 3 21 
3 1 3 4 25 
4 1 4 2 11 
5 2 1 4 22 
6 2 2 2 12 
7 2 3 1 15 
8 2 4 3 19 
9 3 1 2 15 
10 3 2 1 20 
11 3 3 3 23 
12 3 4 4 24 
13 4 1 3 22 
14 4 2 4 21 
15 4 3 2 10 
16 4 4 1 17 


注意 , 在 输出 中 行 与 列 均 用 1,2,3,4 表示 , # 16.24 的 肥料 А,В, С, D 也 分 别 用 1.2 3 4 Ж 
т. НА GLM‘ Yield’ = Rows Columns Treatment; 妈 可 得 到 Minitab 分 析 . 
MTB> GLM ‘Yield’ = Rows Columns Treatment; 
SUBC > SSquares 1; 
SUBC > Brief 2. 


Сепега! Linear Model 


Factor 
Rows 
Columns 


Treament 


Type 
fixed 
fixed 
fixed 


Levels Values 

4 1 2 3 4 
4 1 2 3 4 
4 1 2 3 4 
4 1 2 3 4 


Analysis of Variance for Yield, using Sequential SS for Tests 


Source 
Rows 


Columns 


Treatment 


Error 


Total 


DF Seq SS Adj SS Seq MS F 
3 29.187 29.187 9.729 4.92 
3 4.688 4.687 1.563 0.79 
3 284.187 284.187 94.729 47.86 
6 11.875 11.875 1.979 

15 329.937 


Р 
0.047 
0.542 
0.000 


Minitab 输出 中 Seq MS 列 和 表 16.27 中 均 方 MS 列 一 致 .计算 的 下 值 和 表 16.27 的 下 值 也 相 
癌 . 行 . 列 及 处 理 的 产值 分 别 为 0.047,0.$42,0.000. 由 六 值 的 性 质 可 知 , 在 水 平 0.05 下 , 行 的 均值 
闻 存 在 差异 ,但 在 水 平 0.01 下 ,无 差异 ; 列 的 均值 在 两 种 水 平 下 都 不 存在 差异 ;在 任何 水 平 下 , 肥料 
间 都 存在 差异 .对 四 种 肥料 均值 的 进一步 研究 将 会 看 到 均值 的 差异 到 底 有 多 大 . 


希腊 -拉丁 方 


16.16 研究 四 种 汽油 А,В,С, р 每 加 仓 的 行驶 里 程 是 否 有 区 别 , 这 是 件 很 有 意义 的 事 . 设计 
一 个 试验 , 其 中 涉及 到 4 个 不 同 的 司机 ,4 辆 不 同 的 汽车 , 4 条 不 同 的 马路 . 

EO F 因为 汽油 种 数 ,司机 人 数 ,汽车 数 及 马路 的 条 数 均 相 等 , 所 以 可 用 希腊 -拉丁 方 . 假设 用 行 

来 表示 汽车 而 列表 示 司 机 , 如 表 16.28 所 示 . 现 随机 分 派 汽油 (4, B, C,D) 到 各 行 各 列 ,但 一 定 要 使 

各 个 字母 在 每 行 每 列 只 出 现 一 次 , 这样 就 可 保证 每 个 司机 都 有 机 会 驾驶 各 辆 汽车 , 使 用 各 种 汽油 . 

而 且 每 辆 汽车 不 会 使 用 同一 种 汽油 . 

现 随 机 分 派 四 条 马路 ,用 а, В, У, 0 表示 .按照 拉丁 方 的 方法 来 分 派 . 这 样 , 每 个 司机 均 有 机 会 在 

四 条 马路 上 行驶 . 表 16.28 表示 了 这 种 设计 安排 . 


汽车 1 
汽车 2 


汽车 4 


表 16.28 


16.17 假定 在 习题 16.16 中 ,每 加 仑 汽油 的 行驶 里 程 见 表 16.29， 在 显著 性 水 平 0.05 Т, Я 
用 方差 分 析 的 方法 判断 是 否 存在 差异 ?再 用 Minitab 给 出 的 记 值 进行 分 析 . 


汽车 1 
汽车 2 
汽车 3 
汽车 4 


Ж 16.29 


# E 首先 计算 各 行 各 列 之 和 , 见 表 16. 30. 然 后 计算 每 一 个 拉丁 字母 和 每 -一 个 希腊 字母 对 应 的 


数据 之 和 , 即 
4 之 和 :1$+ 16 + 15 + 16 = 62 


B 2#:19 + 18 + 21 + 23 = 81 
С 之 和 :16+ 11+ 11 +14 = 52 
D 2#:14 +16 + 16 +15 = 61 
а 21:14 + 18 + 15 + 14 
В 2:16 + 16 + 21 + 15 = 68 
y 2:19 + 16 +11 +16 = 62 
6 21:15 + 11+ 16 + 23 = 65 


|| 
а 
м 


再 用 快捷 方法 计算 相应 的 变 差 
行 
2 2 2 2 2 
бз 32 | 622 | 707_ 256. _ 4112.50- 4096 16.50 


аата тат 16 


列 
64 61° 632, 687 2562 _ _ 
4 * 4 * 4 t 4 Че = 4102.50 -409 = 6.50 
汽油 (A, В,С, р) 
62? 812 522 612 256 _ К 
4+4+ +7 6 = 4207.50 – 4096 = 111.50 
马路 (a,B, У, 5) 
61° 68° 622, 652 2562 _ А 
4 t4 +4 7 те = 4103.50 – 4096 = 7.50 
总 变 差 为 i 
2 
V = 19 + 16? + 162 + + + 152 + 232 – 226 = = 4244 – 4096 = 148.00 
随机 变 差 为 


148.00 — 16.50 – 6.50 — 111.50 – 7.50 = 6.00 
结论 见方 差分 析 表 16.31.Nx N 拉丁 方 的 自由 度 为 N2- 1, 各行 各 列 及 拉丁 .希腊 字母 的 自由 
度 为 N -~ 1, 因此 误差 的 自由 度 为 N? -1-4(N-1)=(N-1)(N -3). 本 题 中 NN=4. 


表 16.30 


Ca [a а а 
















y% F 
行 (汽车 ),16.50 5.500 30 = 2.75 
列 (司机 ),6.50 УЗО 1.08 
汽油 (A, В, C,D),111.50 18.6 


2.500 

一 ‚б , А А тое ш 
马路 (a, В, y,6),7.50 2.500 2000 1:25 
残 差 ,6.00 2.000 

总 变 差 ,148.00 





因为 Е, 9503,3) = 9.28, Fu oo(3,3)=29.5, 因 此 可 认为 在 水 平 0.05 下 ,汽油 间 存 在 差异 , 而 水 
平 为 0.01 时 ,不 存在 差异 . 


下 面 是 Minitab 工作 表 的 数据 结构 : 

Row Car Driver Casoline Road MPG 
1 1 1 2 3 19 
2 1 2 1 2 16 
3 1 3 4 4 16 
4 1 4 3 1 14 
5 2 1 1 4 15 
6 2 2 2 1 18 
7 2 3 3 3 11 
8 2 4 4 2 15 
9 3 1 4 1 14 
10 3 2 3 4 11 
11 3 3 2 2 21 
12 3 4 1 3 16 
13 4 1 3 2 16 
14 4 2 4 3 16 
15 4 3 1 1 15 
16 4 4 2 4 23 


注意 上 述 工 作 表 中 汽车 及 司机 的 表示 与 表 16.29 一 样 ,汽油 А,В,С, О 在 工作 表 中 用 1.2 3 
4 表示. 表 16.29 中 的 马路 a, 8, y, 在 工作 表 中 用 1,2,3,4 表示 .通过 命令 MTB> GLM' MPG’ = 
Car Driver Gasoline Road; 即 可 进行 Minitab 分 析 . 
MTB>GLM ‘MPG’ = Саг Driver Gasoline Road; 
SUBC > SSauares 1; 
SUBC > Brief 2. 
General Linear Model 


Factor Type Levels Values 

Car fixed 4 1 2 3 4 
Driver fixed 4 1 2 3 4 
Gasoline fixed 4 1 2 3 4 
Road fixed 4 1 2 3 4 


Analysis of Variance for MGP, using Sequential SS for Tests 
Source DF Seq SS А55 SeMS Е Р 


Саг 3 16.500 16.500 5.500 2.75 0.214 
Опуег 3 6.500 6.500 2.167 1.08 0.475 
Gasoline 3 111.500 111.500 37.167 18.58 0.019 
Road 3 7.500 7.500 2.500 1.25 0.429 
Error 3 6.000 6.000 2.000 


Total 15 148.000 


Minitab 输出 中 Seq MS 列 和 表 16.31 中 均 方 MS 列 一 致 .计算 的 下 值 和 表 16.31 的 下 值 也 相 
同 . 汽 车 司机、 汽油 及 马路 的 产值 分 别 为 0.214,0.475,0.019.0.429 由 户 值 的 性 质 可 知 , 在 水 平 
0.01 & 0.05 下 ,不 同 的 汽车 ,司机 , 马路 间 不 存在 差异 ; 在 水 平 0.05 F, 汽油 品牌 间 存 在 差异 , 而 在 
水 平 0.01 下 , 则 不 存在 差异 . 


综合 习题 
16.18 证 明 №, а, = 0 ( 见 本 章 式 (15)). 
证 明 F 处 理 总 体 均值 ,和 总 体 均值 „ 之 间 有 如 下 关系 


и = TEs (53) 


因为 = jp -pp, 利 用 (53) 式 , 则 
Уа = >)(д,- н) = Ми ар =0 
16.19 ”证明 (a) 本 章 的 (16) 式 , (b) 本 章 的 (17) 式 ， 
证 明 e (a) 由 定义 知 
у» = У EoD [TD - Х,)° ]= ээ; 
其 中 525) 个 处 理 的 样本 方差 ,样本 的 容量 为 .所 以 





E(Vw) = b YE(S?) = DH — || = a(b – 1)o? 
(b) 由 定义 知 


Vg = Фә (X, -XP =b) X -UXX K, + а4&Х? =b) K? - abX? 
1=1 = J=! 1=1 


1=1 = 


因为 了 = 二 了 区， 省略 和 式 的 下 标 j, 则 有 


| Е(Ур) = b) Е(Х?) – аЕ(Х?) 
对 任 一 随机 变量 О, Е(0?2) = var(U)+[E(U)]?, 其 中 var( 咒 ) 表 示 U 的 方差 .因此 
E(X? ) =var(X, ) + [E(X, )] 
E(X?) =var(X) + [Е(Х)]? 
因为 处 理 总 体 服 从 以 p= и + а, 为 均值 的 正 态 分 布 , 所 以 


var( X) =F 


利用 结论 (53) 及 (56) 一 (61) 式 , 可知 


E(Ve) =>, = + (и + a)? |- ab| 5 + p? 
=a0° + bX (y+ a)? – с ~ abg? 
= (а ~ 1)o + абы? + 2би ўа, + ь Ула? + abu? 
= (а – 1)02 + 6 > а! 
16.20 证 明 本 章 的 定理 1. 
证 明 F 如 习题 16.19 所 示 ， 


à V а bS? 
Уу = 62752 或 3 = у) y 
у= 1 @ j=l С 


(54) 


(55) 


(56) 
(57) 


(58) 


(59) 


(60) 
(61) 


其 中 S? 是 从 第 j 个 处 理 总 体 所 抽取 的 容量 为 5 的 样本 方 郑 . 从 第 十 _ 章 (8) 起 可知 53 20р 
g 


1); 又 因 5; 相互 独立 ,所 以 由 第 十 二 章 x? TETE ~ y? (alb -1)). 
б 


th EI 1 
单 因素 方差 分 析 


16.21 为 了 判断 五 种 不 同 品种 小 麦 4,B,C,D,E 广 量 间 是 否 有 差别 而 设计 了 一 个 试验 . 每 个 品种 分 别 种 植 
在 4 块 土地 中 ,产量 ( 满 式 结 / 英 亩 ) 见 表 16.32 .假设 二 地 的 肥沃 度 一 样 , 且 小 麦 品种 随机 地 播种 在 各 


块 土地 中 ,在 显 鞭 性 水 平 (a) 0.05 , (Ь) 0.01 下 判断 产量 间 是 否 存 在 差异 ? 


Т 
Т 
14 
о 
Т 


16.22 ЖАН ЕАК А,В,С, DD. 轮 胎 的 寿命 (由 行驶 的 里 程 数 决定 ), 见 表 16.33 
(单位 ;和 干 英里 ), 其 中 每 种 轮胎 应 用 在 随机 选择 的 6 辆 汽车 上 .在 显著 性 水 平 (a) 0.05 , (b) 0.01 下 
判断 不 同类 型 轮胎 的 寿命 间 是 否 存 在 显著 差异 ? 


туыс ш)» 
: 
шә 
: 
© 
: 





16.23 ” 某 教师 想 检验 三 种 教学 方法 I П ШЕ. АЕ БНТ 15 个 学 生 , 每 个 被 随机 分 在 一 小 
组 ,共有 3 组 ,每 组 5 人 ,实行 一 种 教学 方法 .最 后 对 15 名 学 生 进 行 统一 测试 , 成绩 见 表 16.34. 在 显著 
性 水 平 (a) 0.05 , (b) 0.01 下 判断 三 种 教学 方法 间 是 否 存在 差异 ? 





观测 值 数目 不 等 时 所 作 的 修正 


16.24 表 16.35 列 出 某 种 汽车 使 用 不 同 品牌 的 汽油 时 ， 每 加 仑 所 行驶 的 里 程 数 .在 显著 性 水 平 (a) 0.05, (b) 
0.01 下 判断 不 同 品牌 的 汽油 间 是 否 存 在 差异 ? 





16.25 某 学 期 中 ,一 个 学 生 不 同学 科 的 各 次 成 绩 见 表 16.36. 在 显著 性 水 平 (a) 0.05,(b) 0.01 下 判断 该 学 生 
在 各 门 学 科 上 是 否 存 在 显著 差异 ? 


双 因 素 方 差分 析 


16.26 茶 厂 生产 的 产品 是 由 3 个 工人 在 3 台 不 同 机 器 上 生产 的 ,该 厂 厂 长 希望 了 解 (a) 工人 之 间 有 无 差别 ， 


(b) 机 器 间 有 无 差异 . 表 16.37 是 每 个 工人 在 不 同 机 器 上 一 天 所 生产 的 产品 数 . 在 显著 性 水 平 0.05 
下 对 此 进行 分 析 . 





16.27 在 显著 性 水 平 0.01 下 ,求解 习题 16.26. 

16.28 四 种 不 同 玉米 种 子 种 植 在 5 个 区 组 中 .每 个 区 组 分 为 4 小 块 , 每 小 块 随机 指定 种 植 一 种 玉米 , 产量 见 
Ж 16.38( 单 位 :蒲式耳 /英亩 ). 在 显著 性 水 平 0.05 下 判断 是 否 由 于 (a) 土质 的 不 同 , (b) 玉米 品种 的 
不 同 引 起 产量 的 显著 差异 ? 

16.29 在 显著 性 水 平 0.01 下 ,求解 习题 16.28. l 

16.30 假设 在 习题 16.22 中 ,每 种 轮胎 的 第 -- 个 观测 值 用 在 第 一 种 汽车 上 , 第 二 个 观测 值 用 在 第 二 种 汽车 
上 ,依次 下 去 .在 显著 性 水 平 0.05 下 判断 (a) 轮胎 间 有 无 差异 , (b) 汽车 品牌 间 有 无 差异 ? 

16.31 在 显著 性 水 平 0.01 下 ,求解 习题 16.30. 

16.32 ”假设 在 习题 16.23 中 ,每 种 教学 方法 下 的 第 一 个 数据 是 某 一 所 学 校 学 生 的 成 绩 ， 第 二 个 数据 是 另 一 
所 学 校 学 生 的 成 绩 , 依次 下 去 .在 显著 性 水 平 0.05 下 判断 (a) 教 学 方法 间 有 无 差异 , (b) 学 校 间 有 无 
差异 ? 

16.33 为 了 检验 美国 成 年 女 学 生 的 头发 颜色 和 身高 与 学 生成 绩 是 否 相 关 , 做 了 些 调查 , 结果 见 表 16.39. 其 
中 数据 表示 即将 毕业 学 生 中 成 绩 前 10% 的 人 数 .在 显著 性 水 平 0.05 下 对 此 试验 进行 分 析 . 





16.34 在 显著 性 水 平 0.01 下 ,求解 习题 16.33. 
有 重复 的 双 因 讲 试 验 


16.35 假设 习题 16.21 的 试验 在 美国 南部 施行 , 表 16.32 的 列表 示 四 种 不 同 肥 料 作 用 下 的 亩 产量 , 表 16.40 
是 美国 西部 施行 同样 试验 的 结果 .在 显著 性 水 平 0.05 下 判断 是 否 由 于 (a) 肥 料 的 不 同 ,(b) 所 处 地 域 
的 不 同 引起 产量 的 差异 ? 

16.36 显著 性 水 平 0.01 下 ,求解 习题 16.35. 

16.37 表 16.41 给 出 一 周 各 天 内 4 个 工人 在 2 台 不 同类 型 机 器 了、 上 所 生产 的 产品 数 .在 显著 性 水 平 0.05 
下 判断 (a) 工人 间 是 否 存在 显著 差异 , (b) 机 器 间 是 否 存 在 显著 差异 ? 





拉丁 方 


16.38 为 了 检验 四 种 不 同 施肥 处 理 (A,B,C,D) 及 横向 和 纵向 上 土壤 的 变化 对 玉米 产 基 的 影响 进行 了 试 
验 ,结果 见 表 16.42 的 拉丁 方 ,其 中 的 数据 表示 每 单位 面积 玉米 的 产量 .在 显著 性 水 平 0.01 下 检验 
(а) 肥料 间 没 有 差异 ,(b) 土 壤 间 不 存在 差异 . 

16.39 在 显著 性 水 平 0.05 下 ,求解 习题 16.38. 

16.40 ”见习 题 16.33, 假设 引进 了 一 个 新 因素 一 一 各 个 学 生 的 出 生地 Е, М, W, 见 表 16.43. 在 显著 性 水 平 
0.05 下 判断 是 否 由 于 (a) 身高 的 不 同 , (b) 头 发 颜色 的 不 同 ,(c) 出 生地 的 不 同 引起 女 学 生成 绩 的 显著 
差异 ? 


表 16.42 


Al10jpz 
сви 
в14 | c16 
\р1в| А14 

















А 14 Р 15 








希腊 -拉丁 方 


16.41 为 了 生产 一 种 优质 鸡 饲料 ,在 原配 方 中 增 加 了 两 种 不 同 数量 (数量 分 为 四 个 等 级 ) 的 化 学 药品 , 生成 
16 种 新 饲料 配方 .第 一 种 化 学 药品 的 不 同 数量 用 Ад, В, C, D 表示 ,第 二 种 用 a, 8, у, 6 表示 .根据 煞 
鸡 的 初始 重量 (Wi1, Wa, Ws, Ws) 及 品种 的 不 同 ( S1, S2, 53, S4) 把 它们 分 为 16 组 .每 组 喂 一 种 配方 
的 饲料 .雏鸡 单位 时 间 内 增加 的 重量 见 表 16.44 给 出 的 希腊 -拉丁 方 .在 显著 性 水 平 0.05 F, 用 方差 
分 析 的 方法 进行 分 析 . 





16.42 4 个 公司 (Ci, Ca, Сз, C4) 均 生产 四 种 不 同类 型 的 电缆 ( Г,.Т, Тз, T4), 4 LACA, B,C, р) Ња 
台 机 器 (a, 8, ,9) 测 量 电线 的 强度 , 测 得 的 平均 强度 见 表 16 45 的 希腊 -拉丁 方 .在 显著 性 水 平 0.05 
下 ,用 方差 分 析 的 方法 进行 分 析 ， 


表 16.45 
2 
: Св 212 А, 188 
В, 157 | А, 172 С, 136 













16.43 表 16.46 给 出 了 经 过 三 种 化 学 药品 A, B,C 处 理 过 的 铁锈 厚度 .在 水 平 (a)0.05, (b) 0.01 下 判断 处 理 
间 是 否 存 在 显著 差异 ? 


16.44 一 试验 用 来 测量 高 中、 矮 三 级 成 年 男 学 生 的 智商 , 结果 兄 表 16.47. 在 水 平 (a) 0.05,(Ь) 0.01 下 判断 


是 否 由 于 身高 的 差异 而 智商 有 所 差异 ? 





16.45 证 明 本 章 的 结论 (10), (11) 和 (12) 式 . 
16.46 不 同 智商 的 熟练 工人 与 非 熟练 工人 的 成 绩 结果 见 表 16.48. 在 水 平 0.05 下 判断 是 否 由 于 (a) 熟练 程 
度 ,(b) 智商 的 不 同 而 引起 得 分 的 不 同 ? 





16.47 在 显著 性 水 平 0.01 下 ,求解 习题 16.46. 
16.48 表 16.49 给 出 了 来 自 不 同 地 区 ,不 同 智 商 的 一 组 大 学 生 的 测验 成 绩 . 在 水 平 0.05 下 ,分 析 此 表 , 并 陈 
述 结 论 . 


表 16.49 
得 分 


高 智商 中 等 智商 低 智商 


16.49 在 显著 性 水 平 0.01 下 ,求解 习题 16.48. 

16.50 ”对 于 习题 16.37, 你 是 否 能 断定 一 周 内 各 天 生产 的 产品 数 间 存 在 显著 差异 ”请 解释 

16.51 在 方差 分 析 的 计算 中 ,从 输入 数据 中 加 减 一 个 适当 的 常数 , 并 不 影响 结论 . 若 对 每 个 输入 数据 均 乘 以 
或 除 以 某 个 定常 数 , 结论 又 会 如 何 ? 

16.52 ЖАЖА ЗЕ, 推导 (24), (25) 和 (26) 式 . 

16.53 ”假设 习题 16.43 中 表 16.46 的 数据 取 自 于 美国 东北 地 区 ,而 表 16 50 取 目 于 西北 地 区 .在 显著 性 水 平 
0.05 下 ,判断 是 否 由 于 (a) 化 学 药品 的 不 同 , (b) 地 区 的 不 同 而 引起 铁锈 厚度 有 所 差异 ? 





16.54 见习 题 16.21,16.35, 假设 在 美国 东北 部 也 进行 了 试验 , 结果 见 表 16. 51. 在 显著 性 水 平 0.05 下 判断 
是 否 由 于 (a) 肥料 的 不 同 , (b) 地 区 的 不 同 而 引起 产量 方面 有 所 差异 ? 


16.55 在 显著 性 水 平 0.01 下 ,求解 习题 16.44. 
16.56 在 显著 性 水 平 0.01 下 , 对 表 16.52 给 出 的 拉丁 方 进行 方差 分 析 , 并 陈述 结论 . 
16.57 设计 一 个 试验 ,形成 如 表 16.52 所 示 的 拉丁 方 . 


表 16.52 






因子 1 


16.58 ”在 显著 性 水 平 0.01 Т, 对 表 16.53 给 出 的 希腊 -拉丁 方 进行 方差 分 析 , 并 陈述 结论 . 









因子 2 











表 16.53 
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16.59 设计 一 个 试验 ,形成 如 表 16.53 所 示 的 希腊 -拉丁 方 ， 

16.60 描述 在 有 重复 的 三 因素 试验 中 , 怎样 运用 方差 分 析 的 方法 . 

16.61 设计 一 个 试验 ,分 析 习 题 16.60 的 求解 过 程 . 

16.62 证 明 本 章 的 (a) GOR, (Ь) (31) 一 (34) 式 ， 

16.63 FKE, 你 能 找到 一 个 (a) 2x2 拉丁 方 ,(b) 3x 3 希腊 -拉丁 方 吗 ?” 请 解释 





第 十 七 章 ” 非 和 参数 检验 


5| 


前 几 章 所 考虑 的 许多 假设 检验 , 均 需 要 样本 所 依赖 的 总 体 的 分 布 的 某 些 假定 .例如 , 第 
六 章 的 单 因素 方差 分 析 要 求 总 体 服 从 正 态 分 布 , 且 标 准 差 相等 . 
实际 情况 中 ,上 述 的 假定 不 一 定 完全 合理 ,或 者 在 应 用 中 对 这 些 假定 有 怀疑 .例如 总 体 分 
布 上 共有 高 度 偏 性 的 情形 .因此 ,统计 学 家 设计 了 许多 与 总 体 的 分 布 及 相关 参数 无 关 的 检验 方 
法 ,因此 被 称 之 为 非 参 数 检验 . 
非 参 数 检验 可 用 来 代替 复杂 检验 , 尤其 在 处 理 非 数 值 数 据 方面 作用 很 大 .例如 由 顾客 对 某 
种 合 类 食品 的 爱好 程度 划分 等 级 而 得 到 的 数据 . 


符号 检验 


K 17.1 表示 两 种 不 同类 型 的 机 器 ( 工 、I ) 在 连续 12 天 内 所 生产 的 不 合格 螺 检 数 , 假设 机 
妖 每 天 的 生产 量 相等 .我 们 希望 检验 假设 日 ,: 机 器 之 间 无 差异 , 即 表 中 所 列 的 机 器 生产 的 不 合 
格 品 数 的 不 同 仅 仅 是 随机 误差 所 引起 , 因此 可 认为 两 组 样本 来 自 于 同一 总 体 . 


表 17.1 





对 于 这 种 成 对 出 现 的 样本 , 有 一 种 简单 的 非 参 数 检 验方 法 :符号 检验 .这 种 方法 首先 计算 
两 种 机 器 每 天 所 生产 的 不 合格 品 的 差 值 , 然后 记 下 其 差 值 的 符号 . 例如 :第 一 天 其 差 值 为 47 - 
71, 是 负 值 ,因此 取 负 号 . 同 理 得 到 如 下 符号 序列 . 

一 一 十 一 一 一 十 一 十 一 一 一 (1) 
(其 中 有 3 正 9 负 ). 假 如 +, – 号 出 现 的 可 能 性 一 样 ,我 们 会 得 到 6 个 +,6 个 - .检验 Н, В 
相当 于 在 投 气 一 枚 硬币 12 次 出 现 3 次 正面 (+ )、9 次 反面 (- ) 的 结论 下 检验 此 硬币 是 否 均 
习 . 这 了 台 涉及 到 第 七 章 所 提 到 的 二 项 分 布 .习题 17.1 说 明 在 显著 性 水 平 0.05 F, 利用 二 项 分 
布 的 双边 检验 ,我 们 不 能 拒绝 Ho 即 在 此 显著 性 水 平 下 , 两 种 机 器 间 不 存在 差异 . 

ЖІ 者 茶 天 两 机 器 生产 出 相同 的 不 合格 品 ,序列 (1) 中 将 出 现 0. 此 时 , 我 们 可 忽略 0 所 
对 应 的 成 对 样本 值 , 仅 用 11 对 观测 值 来 代替 12 对 观测 值 . 

注 2 通过 对 样本 进行 连续 性 修正 , 可 用 正 态 分 布 近似 表示 二 项 分 布 (见习 题 17.2). 

尽管 符号 检验 对 成 对 数据 特别 适用 (如 表 17.1 所 示 ), 它 也 可 以 用 来 解决 单个 样本 的 问题 
(见习 题 17.3,17.4). 


Mann-Whitney U 检验 


R 17.2 表示 由 两 种 不 同 的 合金 ( 工 , 工 ) 所 制造 的 电缆 的 强度 .此 表 中 有 两 组 样本 , 对 应 于 
合金 收集 了 8 个 数据 ,合金 耻 收 集 了 10 个 数据 .我 们 想 利用 这 些 数据 判断 样本 间 是 否 存在 
Ж, 或 等 价 于 两 组 样本 是 否 取 自 于 同一 总 体 .尽管 此 问题 可 通过 第 十 一 章 的 4 检验 得 到 解 
次 , 一 种 称 为 Mann-Whitney U 检验 ,或 简称 为 如 检验 的 方法 也 同样 适用 .此 方法 由 下 列 步 又 
构成 : 


Ф 17.2 


合金 I 合金 下 
18.3 16.4 22.7 17.8 12.6 14.1 20.5 10.7 15.9 
18.9 25.3 16.1 24.2 19.6 12.9 15.2 11.8 14.7 


第 一 步 :合并 两 组 数据 , 并 按 递增 的 顺序 排列 , 然后 根据 各 个 数据 在 序列 中 的 位 置 依 次 给 
他 们 编号 (数据 的 编号 称 为 该 数据 的 秩 ), 此 例 中 从 1 到 18. 当 有 两 个 或 两 个 以 上 样本 值 相 等 
( 称 存在 结 点 或 者 结 ) 时 , 它们 的 秩 均 被 赋 子 同一 结 点 秩 的 均值 . 例如 车 将 表 17.2 中 的 数据 


18.9 改 为 18.3, 则 有 两 个 18.3, 它们 的 秩 分 别 为 12 和 13, 但 因为 它们 相等 ， 所 以 用 六 (12 十 


13) =12.5 来 作为 他 们 共同 的 秩 . 

第 二 步 :计算 每 组 样本 的 秩 和 (此 例 中 为 合金 工 与 合金 巩 各自 的 秩 和 ), 用 R, R, 表示 .用 
№, № 表示 各 个 样本 的 容量 ,为 了 计算 方便 , 若 样本 容量 不 等 , 令 Ni 为 较 小 样本 容量 (此 全 
中 Ni 8), WUE Ni <М№,, К, ЖП R 分 别 与 Ni 和 Ni; 相对 应 . 秩 和 R, 和 R 之 间 的 显著 
性 差异 则 意味 着 样本 间 存 在 显著 性 差异 . 

第 三 步 :为 了 检验 秩 和 之 间 是 否 存 在 差异 , 从 样本 1 出 发 得 到 如 下 统计 量 

U = мм, + “Ман р (2) 
在 两 样本 间 无 差异 时 , U 的 抽样 分 布 对 称 , 且 均 值 和 方差 可 由 如 下 公式 计算 . 
МҮМ, 2 NiN,(N1+ М, +1) 
HU 7 2, , бұ 一 12 (3) 

Ж Ni, № 均 大 于 等 于 8, 可 证 明 U 的 分 布 渐 近 于 正 态 分 布 .因此 
浙 近 于 标准 正 态 分 布 .通过 附录 贡 ,我 们 可 判断 样本 间 是 否 存在 显著 性 差异 .习题 17.5 说 明 在 
0.05 КЕТ, 电缆 间 存 在 显著 性 差异 . 

ЖЗ 利用 样本 2, 我们 也 可 得 到 如 下 统计 量 : 

U = №№, + MN +1) - R, (5) 

它 的 抽样 分 布 与 (2) 一 致 ,均值 和 方差 计算 公式 如 (3) .统计 量 (5) 与 (2) 是 相关 的 , 因为 若 
Ui 与 U, 分别 表 示 统 计量 (2) 与 (5), 则 

О; + U, = №№, (6) 


Ri + В = МАУ (7) 


其 中 N= № + №. ПЕВ LE). 
#4 (2) 中 的 统计 量 U 表示 在 对 所 有 样本 值 按 递增 顺序 排列 后 , 样本 1 的 值 小 于 样本 2 
的 值 的 次 数 总 和 . 这 就 为 我 们 提供 了 另 一 种 计算 统计 量 U 的 计数 方法 . 


Kruskal-Wallis H 检验 


U 检验 是 决定 两 组 样本 是 否 来 自 于 同一 总 体 的 非 参 数 检验 . 当 样 本 不 是 两 组 , 而 是 组 
时 ,检验 & 组 样本 是 否 取 自 于 同一 总 体 ,就 要 采用 Kruskal-Wallis H 检验 , 简称 为 H 检验 . 

此 检验 可 描述 如 下 : 设 有 A 组 容量 分 别 为 Ni, N,,…, №, 的 样本 , 令 N= Ni+ М; + 
№,, HIR k PEURA DORINTE ESUR аан К, R,,…, В, Е ХАТЕ 


Н = ноғ м +3(N + (8) 


可 证 明 H 的 分 布 非常 接近 于 自由 度 为 & -1 的 x“- 分 布 ,这 里 假设 Му, №, ,Ne 至 少 之 5. 
日 检验 为 单 因素 方差 分 析 提 供 了 一 种 非 参 数 方法 ,也 可 进行 推广 . 


有 结 点 时 Н 检验 的 修正 


车 样本 观测 值 中 有 太 多 的 结 ,统计 量 (8) 的 H 值 比 应 有 的 值 小 , 为 此 要 进行 修正 .修正 后 
的 值 记 为 再 ,可 通过 修正 因子 


X(T? - Т) 


N = М 


(9) 


3 -1 
RAMH, = |1- an н, жнт ЕУ АНА Ч, RE Ш 


表示 对 所 有 结 点 的 Т?- Т ЖШ. ERA, Ш Т = 0, (9) 式 变 为 1, 此 时 无 须 进行 修正 . 实际 
上 ,一 般 情况 下 修正 可 被 忽略 ， 


随机 性 的 游程 检验 


仿 管 单词 "随机 "在 本 书 中 已 用 过 多 次 (例如 “随机 抽样 "“ 随 机 投掷 一 枚 硬币 ), 但 前 几 章 
并 未 给 出 任何 对 随机 性 的 检验 .游程 论 则 提供 了 一 种 对 随机 性 的 非 参 数 检验 . 
要 理解 什么 是 游程 , 先 考 虑 由 两 个 变量 a,b 所 构成 的 序列 , 如 
aalbbblalbblaaaaalbbblaaaa | (10) 
ВТЕ ВЕ — ВСЕ т а, 用 a 表示 “正面 ",6b 表示 “反面 ”; 或 在 机 器 生产 的 螺栓 中 , a 表示 
“不 合格 品 ", 2 表示 “合格 品 ”. 
游程 可 以 这 样 定义 , 即 包含 在 两 个 不 同 符号 间 的 同一 符号 集 . 从 左 到 右 观 察 序列 (10) Ж 
有 7 个 游程 , 各 个 游程 间 用 “1” 隔 开 , 第 一 个 游程 包含 两 个 a, 第 二 个 游程 含有 3 个 5, 第 三 个 
洲 程 含有 1 个 a, 等 等 . 
很 显然 , 在 序列 的 随机 性 和 其 游程 的 个 数 之 间 应 有 某 种 关系 存在 . 再 看 序列 
alalplalplalplalpla1BI (11) 
EM а 到 50, 再 从 到 <, 如 此 排列 下 去 , 因此 是 一 个 周期 模型 ， 这 样 的 模型 几乎 不 可 能 认 
为 有 随机 性 存在 , 此 时 我 们 认为 游程 过 多 . 
为 一 方面 ,序列 
aaaaaalbbbb|laaaaalbbb | (12) 
又 好 像 是 一 个 趋势 模型 , 其 中 a 和 2 彼此 成 群 出 现 , 此 时 游程 又 过 少 ， 这 样 的 序列 也 不 能 
认为 是 随机 的 . 
由 上 可 知 ,一 个 序列 游程 过 多 或 过 少 都 会 被 看 成 是 非 随 机 的 ， 否则 可 认为 是 随机 的 .为 了 
恰 验 序列 的 随机 性 , 我们 考虑 由 М, а Я, БОМ, + №, = N) 任 意 排列 的 长 度 为 N 的 序 
列 .从 这 些 序列 集 我 们 得 到 一 个 抽样 分 布 .统计 量 Y 一 一 每 个 序列 的 游程 个 数 的 抽样 分 布 .其 
均值 和 方差 如 下 .、 





一 , OC 二 OO 
РУ М+М, ” (м + №) (М + №, 1) 


运用 公式 (13), 可 以 在 给 定 显著 人 性 水 平 下 ， 对 序列 的 随机 性 进行 检验 .在 N; 和 №, 均 不 小 于 8 
的 条 件 下 ,可 以 证 明 统 计量 у 的 分 布 非常 接近 于 正 态 分 布 .因此 
V 一 Hy 
z = Ta (14) 


渐 近 于 标准 正 态 分 布 . TAARE TRR. 
游程 检验 的 进一步 应 用 
下 面 是 游程 检验 的 其 他 方面 的 应 用 . 


1. 数值 数据 高 于 中 位 数 和 低 于 中 位 数 的 随机 性 检验 .为 了 判断 数值 数据 (例如 收集 在 样 
本 中 的 数据 ) 是 否 随 机 , 首先 按照 数据 收集 的 先后 次 序 把 数据 排列 , 然后 计算 出 数据 的 中 位 数 ， 
再 根据 每 一 个 原始 数据 是 高 于 还 是 低 于 中 位 数 分 别 用 a (高 于 ) 和 5( 低 于 ) 来 替换 原始 数据 ， 
PHRES PRS, 则 剔除 出 样本 .样本 是 否 随 机 就 可 根据 a, b 序列 是 否 随 机 来 判断 (见习 
题 17.20). 

2. 样本 所 在 总 体 的 差异 .假设 容量 为 m Mn 的 两 组 样本 , 其 元 素 分 别 为 al,a，…,a 及 
biba ,pb 为 了 判断 两 组 样本 是 否 取 自 同一 总 体 , 首先 合并 两 组 样本 ,使 其 成 为 一 递增 序 
列 ,序列 长 度 为 m + . 若 序 列 的 菜 些 值 相 同 ,可 通过 随机 方法 (例如 运用 随机 数 ) 来 对 它 进 行 
排序 .大 最 后 的 序列 是 随机 的 ,可 知 样本 间 不 存在 差异 , 即 来 自 于 同一 总 体 , 否则 来 自 于 不 同 总 
体 . 此 检验 可 作为 Mann-Whitney U 检验 的 备用 选择 (见习 题 17.21). 


Spearman 秩 相 关 


非 参 数 方法 也 能 用 来 检测 两 个 变量 X,Y 的 相关 性 . 若 变量 的 值 不 是 很 精确 时 , 可 以 将 每 
组 数据 按照 大 小 、 重 要 性 等 方式 排序 , 从 1 到 N 确定 它们 的 秩 ,用 数据 的 秩 代替 数据 的 值 来 分 
析 变 量 间 的 相关 性 . 若 X, Ү 均 按 此 方式 排序 , 秩 相 关系 数 或 Spearman 秩 相关 公式 定义 如 下 ， 
6 òD? 
N(N?-1) 
其 中 р 表示 相应 X,Y 的 值 所 对 应 秩 的 差 值 , N 是 成 对 数据 (和 , YY) 的 个 数 ， 


r = 1 -— 


(15) 


习题 及 解答 
符号 检验 


17.1 见 表 17.1, 在 显著 性 水 平 0.05 下 检验 零 假设 Ho: 机 器 工 和 机 器 下 产量 间 没 有 差异 ， 
备 择 假 设 Н,. 机 器 工 和 机 器 了 产量 间 存 在 差异 
解 假设 随机 变量 X 表示 同一 条 件 下 , 投 撕 一 枚 均匀 硬币 12 次 正面 出 现 的 次 数 .多 =0, 1,-…， 
12. 图 17-1 为 X 的 二 项 分 布 图 (近似 正 态 曲 线 ). 从 第 七 章 有 关 知 识 知 ， X = 的 概率 为 


Ps D = (PA A) 
由 此 可 知 
P(X = 0) = 0.00024, P(X=1)= 0.00293, 


Р(Х = 2) =0.01611, Р(Х = 3) = 0.05371. 


Р(Х=і) 
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图 17-1 


因为 假设 H 表示 机 器 间 存 在 差异 , 而 非 机 器 工 产量 高 于 机 器 下 ,所 以 采用 双边 检验 .给 定 显著 


=н 


性 水 平 0.05, 则 每 侧 的 尾 概率 为 了 x 0.05 =0.025. 逐 渐 增 加 左 侧 尾 概率 直至 其 和 超过 0.025, ВП 


Р(Х < 2) = 0.00024 + 0.00293 + 0.01611 = 0.01928 
Р(Х <3) = 0.00024 + 0.00293 + 0.01611 + 0.05371 = 0.07299 

E 5 0.01928 < 0.025 < 0.07299, 知 正 面 出 现 的 次 数 不 超过 2( 或 从 对 称 角 度 来 说 ,正面 出 现 次 
数 不 小 于 10), 我 们 就 拒绝 零 假 设 Ho, 但 是 此 时 正面 出 现 的 次 数 为 3( 本 章 序 列 (1) 中 + 号 的 个 数 )， 
所 以 水 平 0.05 下 不 能 拒绝 互 o, 即 认为 在 此 水 平 下 ,机 器 产量 间 没 有 差异 . 
利用 二 项 分 布 的 正 态 遂 近 求解 习题 17.1. 
E F 对 于 二 项 分 布 的 正 态 台 近 , 可 构造 统计 量 

_ -gk _X-Np 
б Ура 

因为 二 项 分 布 随机 变量 X 是 离散 的 , 而 正 态 分 布 连续 , 所 以 必须 进行 连续 性 修正 (例如 正面 次 数 3 其 
实 就 是 介 于 2.5 到 3.5 间 的 一 个 数 ). 当 X> Np 时 ,用 Х-0.5 替换 XX; 当 Х< Np 时 , 相应 增加 0.5. 
此 题 中 N=12,p= Np=12x0.5,o= VNpg= V12x0.5x0.5=1.73, 因 此 


(3+0.5)-6 
1.73 == 1.45 


因为 -1.45> -1.96( 一 1.96 为 水 平 0.05 下 的 双 侧 分 位 数 ), 可 得 到 与 习题 17.1 相同 的 结论 . 

ЕЖ, Р(2< -1.45) =0.0735, 和 习题 17.1 中 的 P(X 二 3) =0.07299 非常 接近 . 
РОК 公司 宣称 它 生 产 的 某 种 电池 的 寿命 超过 250 小 时 .一 顾客 希望 验证 此 声明 是 否 符 
合 实际 情况 ,为 此 检测 了 该 公司 生产 的 24 个 电池 ,结果 见 表 17.3. 假 设 样本 是 随机 抽 
取 的 ,在 显著 性 水 平 0.05 下 判断 该 公司 的 声明 是 否 确切 . 先 用 手 算 方 法 进行 符号 检 
验 , 再 用 Minitab 求解 . 


Ж S 假设 H, 表示 该 公司 电池 的 寿命 为 250 小 时 , Н, 表示 寿命 大 于 250 小 时 要 对 Ho, Н, Ж 


行 检 验 , 可 用 符号 检验 的 方法 . 先 从 表 17.3 的 每 个 数据 中 减 去 250, 记 下 各 数 的 符号 , 见 表 17.4. 有 
15 个 加 号 ,9 个 减 号 . 


表 17.3 


加 加 加 四 四 四 区 
四 国医 四 四 四 本 区 
ОЛЕЗЕЦЕЛЕЛЕЛЕ? 
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EKF 0.05 下 , 运用 单 边 检验 , 若 z 值 大 于 
1.645( 见 图 17-2), 则 拒绝 Ho. Xt z 进行 连续 性 修 
ТЕ, W 

— Z Ve — х 0. — 
因此 在 水 平 0.05 下 ,该 公司 的 声明 不 能 被 证 实 . 

用 Minitab 求解 过 程 如 下 . 表 17.3 中 的 数据 输 

图 17.9 A Minitab 工作 表 中 成 为 一 列 . 此 列 命 为 Lifetime. 
命令 STest 250 ‘Lifetime’ 即 可 得 到 如 下 输出 , 子 命 
令 Alternative 1 表示 进行 右 侧 检 验 . 





MTB> STest 250 ‘Lifetime’; 
SUBC > Alternative 1. 
Sign Test for Median 
Sign test of median = 250.0 versus > 250.0 
М Below Equal Above Р — Median 
Lifetime 24 9 0 15 0.1537 257.5 


单 边 检验 的 p- 值 为 0.1537. 它 是 零 假 设 被 拒绝 的 最 小 显著 性 水 平 ,因为 0.05<0. 1537, 所 以 在 水 平 
0.05 下 不 拒绝 零 假 设 . 


17.4 表 17.5 给 出 了 一 次 全 国 考试 中 40 个 学 生 的 成 绩 .在 显著 性 水 平 0.0$ 下 ,检验 假设 
(а) 参加 此 次 考试 的 学 生成 绩 中 位 数 为 66, (b) 参加 此 次 考试 的 学 生成 绩 中 位 数 为 75. 
先 用 手 算 方法 进行 符号 检验 , 再 用 Minitab Ж. 


表 17.5 
=[»5»[=[е[«[=#[»[ж- 
eula] n| a|n e a 
е о а |9 5 5 о а 
о [вю је |в |ж [е е 


М EF (а) 317.5 数据 中 均 减 去 66, 仅 保留 其 符号 , 得 到 表 17.6. 其 中 有 23 个 加 号 , 15 个 减 
号 ,2 个 0. 删 除 0 项 , 则 样本 仅 包含 38 个 符号 , 23 个 加 号 ,15 个 减 号 .用 正 态 分 布 的 双边 检验 (左右 


尾 概率 各 为 六 х 0.05 = 0.025), 则 检验 规则 ;车 一 1.96 三 z 达 1.96, 则 接受 假设 , 否则 拒绝 假设 














因为 






(23 — 0.5)— 38 х 0.5 和 面积 = 0.025 面积 = 0.025 


С  Jaxosxos ` l1 
所 以 在 水 平 0.05 下 ,接受 中 位 数 为 66 的 假设 . а м. 
我 们 也 可 用 15 一 一 碱 号 的 个 数 进行 计算 , 此 时 2 =-1.96 2=196 


„ = (15+0.5)— 38x0.5 -1.14 
v38 x0.5x0.5 | 图 17-3 


结论 相同 . 
(b) 从 表 17.5 中 减 去 75 得 到 表 17.7, 其 中 有 13 个 加 号 ,27 个 减 号 . 因为 


z= 13+ 0.5) - 40x0.5 -2.06 
v40x0.5x0.5 


在 水 平 0.05 下 ,拒绝 中 位 数 为 75 的 假设 . 





用 此 方法 , 可 得 到 中 位 数 的 95% 置信 区 间 ( 见习 题 17.30). 

用 Minitab 求解 过 程 如 下 . 表 17.5 中 的 数据 输入 Minitab 工作 表 中 成 为 一 列 .此 列 命 为 Grade . @ 
令 STest 66 ‘Grade’ 即 可 得 到 如 下 输出 , 子 命令 Alternative 0 表示 进行 双边 检验 . 
МТВ > STest 66 ‘Стаде’: 
SUBC > Alternative 0. 


Sign Test for Median 
Sign test of median = 66, 00 versus not ~ 66.00 
N Below Equal Above P Median 

Grade 40 15 2 23 0.2559 70.00 
此 检验 的 广 值 为 0.2559. 它 是 零 假 设 被 拒绝 的 最 小 显著 性 水 平 , 因为 0.05< 0.2559, 所 以 在 水 平 
0.05 下 不 拒绝 零 假设 .用 75 替换 上 述 命令 中 的 66, 即 可 得 到 在 假设 中 位 数 为 75 下 的 结论 .结果 如 
下 ,新 的 广 值 为 0.038$, 所 以 在 水 平 0.05 下 ,拒绝 中 位 数 为 75 的 零 假设 . 
MTB > STest 75 ‘Стаде’; 
SUBC > Alternative 0. 
Sign Test for Median 


Sign test of median = 75.00 versus not = 75.00 


N Below Equal Above P Median 
Grade 40 27 0 13 0.0385 70.00 


Mann-Whitney U 检验 


17.5 WX 17.2, 在 水 平 0.05 下 ,判断 由 合金 I 与 合金 了 制造 的 电缆 间 是 否 有 差异 ? 先 用 手 
算 方 法 进行 Mann-Whitney U 检验 ,再 用 Minitab 求解 . 
解 F 由 本 章 前 面 的 叙述 得 到 第 1,2, 3 步 . 
第 一 步 : 合并 18 个 样本 值 ,从 小 到 大 进行 排列 ， 并 在 每 个 样本 值 下 标 上 其 秩 . 具体 见 表 17.8. 


表 17.8 


qe gefa ve TE EE 
а Te [>ш еу [ре [вт 


第 二 步 : 计算 各 个 样本 的 秩 和 Ri, R,, 得 到 表 17.9. 合金 I 的 秩 和 К, 为 106, 合金 [的 秩 和 RR， 






为 65. 
表 17.9 
合金 I 合金 
电缆 强度 秩 电缆 强度 秩 
18.3 12 12.6 3 
16.4 10 14.1 5 
22.7 16 20.5 15 
17.8 11 10.7 1 
18.9 13 15.9 8 
25.3 18 19.6 14 
16.1 9 12.9 4 
24.2 17 15.2 7 
和 106 11.8 2 
14.7 6 
和 65 


第 三 步 : 因为 合金 I 的 样本 容量 较 小 , 所 以 №, =8, NN;=10. 相 应 的 秩 和 为 ЮЕ, = 106, R, =65. F 
是 


МСМ, +1 
О = мм + MED R -gx10+8 9 





~ 106 = 10 


17.6 


17.8 








Вит у “27 = 40, 
2 O NiNa(N;+ М; +1) _ 8 x 10x19 = 126.67 
U 12 
因此 
U- ни _ 10-40 
dy = 11.25, z = m = 11 55 = ~ 2.67 


因为 假设 Ho 是 合金 间 不 存在 差异 ,所 以 采用 双边 检验 .在 水 平 0.05 下 ,判别 规则 如 下 ;车 1.96 三 z 
过 1.96, 则 接受 假设 Ho, 否则 拒绝 假设 Ho. 

因为 z= -2.67, 拒 绝 假设 Ho 认为 在 水 平 0.05 下 ,合金 1、 卫 间 存在 差异 . 

Minitab 求解 过 程 如 下 . 先 把 合金 I 了 [的 数据 各 输入 到 Minitab 工作 表 的 一 列 中 , 命名 为 AlioyI、 
AlloyII. 命令 Mann-Whitney 95. 0 * АШоуІ’ “AloyI 即 可 得 到 总 体 中 位 数 之 差 的 95% 置 信 区 间 , 
Mann- Whitney 程序 用 来 检验 中 位 数 相等 的 假设 .Alternative 0 表示 双边 备 择 假设 . 

MTB > Mann-Whitney 95.0 “Alloyl” “Alloyil ; 
SUBC > Alternative 0. 


Mann-Whitney Confidence Interval and Test 


AlloyI N=8 Median = 18.600 
AlloyII N=10 Median = 14.400 
Point estimate for ETA1-ETA2 is 4.800 
95.4 Percent CI for ETA1-ETA2 is (2.000,9.401) 
W= 106.0 


Test of ETA1 = ЕТА2 vs ETA1 not = ЕТА? is significant at 0.0088 

Minitab 输出 给 出 了 每 个 样本 的 中 位 数 ,总 体 中 位 数 差 的 点 估计 以 及 置信 区 间 , 第 一 个 变量 (此 例 中 为 
Alloy1) 的 秩 和 ,双边 检验 的 p 值 =0.0088. 因 为 0.0088<0.05( 显 著 性 水 平 ), 所 以 拒绝 零 假设 , 即 认 
为 全 金工 制造 的 电缆 强度 大 ， 

利用 习题 17.5 的 数据 , 验证 本 章 的 结论 (6) 和 (7). 

М F (a) 由 样本 1, 样本 2 


Ni(Ni1+1 
О, = №№, + 1( > 1) 





- Р, = 8х 10 + 


8х9 Е 
> – 106 = 10 





№(№ + 1) 
5 _ 


К, = 8 x 10 + U 


— 65 = 70 
Ж 0, + 0, =10 + 70= 80, №, №, = 8х 10 80. 
(b) HX Е, =106, R,=65, 所 以 В, + R, = 106+65=171, 


ММ +1) (мМ + №) (М + № +1) 18х19 
2 5 0 = 2 = 171 


HAEE RAAE U 来 求解 习题 17.5. 
解 EF 对 于 合金 了 的 样本 ， 





М + 
U = М, М, + 2\ 52 1) — 





R, =8x10+ 


10 x 11 
2 — 65 = 70 


因此 


此 处 的 « 值 是 习题 17.5 的 > 值 的 相反 数 (以 正 态 分 布 的 右 尾 代替 左 尾 ) .因为 2 值 落 在 [ - 1.96, 
1.96] 之 外 , 则 结论 与 习题 17.5 相同 . 


某 教授 给 两 个 班 上 心理 学 课 . 上午 班 有 9 个 学 生 ， 下 午 班 有 12 个 学 生 . 所 有 学 生 同 时 
进行 期 末 考 试 , 成绩 见 表 17.10, 给 定 显著 性 水 平 0. 05, 你 是 否 能 认为 上 午 班 的 成 绩 比 
下 午 班 差 ? 先 用 手 算 方法 进行 Mann-Whitney U 检验 , 再 用 Minitab 求解 . 

мМ EF 


Ж 17.10 


上 午 班 | 73 87 79 75 82 66 95 75 70 
下 午 班 | 86 81 84 88 90 85 84 92 83 91 53 84 


第 一 步 : 表 17.11 给 出 了 成 绩 与 相应 的 秩 , 其 中 两 个 相同 成 绩 75 HEIZ +6)=5.5, 三 个 相同 
成 绩 84 的 秩 为 了 (11+ 12+13)=12. 
¥ 17.11 


66 | 70 ! 73 | 75 75 |79 |81 |82 |83 |84 84 84|85 |86 | 87 1 88 190 [91 192 |95 
2 3 | 4 5.5 71819 [10 12 14 |15 |16 | 17 |18 |19 |20 |21 
第 二 步 : 由 表 17.10 MR 17.11 得 到 表 17.12.81 RI=73, R,=158,N= NI+N;=9+12=21, 因 此 
Ri + R,=73+158=231 
















м = А22 =- 231 = К, + Р, 





表 17.12 





№М,0№, +1) 9 х 10 











U =М,М, + 2 -К,=9х12+ 2 — 73 = 80 
№№ 9x12 
"су = 2 = 54 
2 -MMN МУ) 9х12х22_ 
бр = 12 т 12 T 
因此 
U =- uu 80- 54 
== a 7 1407 “1-85 


因 我 们 希望 在 水 平 0.05 下 ,检验 备 择 假设 H: 上 午 班 学 生成 绩 比 下 午 班 差 对 零 假 设 Ho: 两 班 
学 生成 绩 无 差异 ,所 以 考虑 单 边 检验 .由 图 17-2 可 知 , 判别 规则 如 下 ,车 21.645, 则 接受 假设 Ho, 
否则 拒绝 假设 Ho. 

因为 z=1.85>1.645, 拒 绝 假设 H,, 认 为 在 水 平 0.05 F, 上午 班 学 生成 绩 比 下 午 班 差 在 水 平 
0.01 下 ,不 能 得 到 此 结论 ,因为 此 时 临界 值 为 2.33, 而 1.85 比 2.33 小、 

Minitab 求解 过 程 如 下 : 先 把 上 午 班 及 下 午 班 的 数据 各 输入 到 Minitab 工作 表 的 一 列 中 , 命名 为 
Morning, Afternoon. 命令 Mann-Whitney 95.0 ‘ Morning’ “Afternoon' 即 可 得 到 总 体 中 位 数 之 差 的 
95% 置信 和 区间， Mann-Whitney 程序 用 来 检验 中 位 数 相 等 的 假设 . Alternative-1 表示 左 侧 单 边 检验 、 
МТВ > Mann-Whitney 95.0 * Morning’ ‘Afternoon’ ; 

SUBC > Alternative-1. 


Mann- Whitney Confidence Interval and Test 


Morning N=9 Median = 75.00 
Afternnon N= 12 Median = 84.50 
Point estimate for ETA1-ETA2 is 一 9.00 
95.7 Percent СЇ for ETAL ~ ETA2 is ( — 15.00,2.00) 
W= 73.0 


Test of ETAL = ETA2 vs ЕТА1 < ETA? is significant at 0.0350 
The test is significant at 0.0348 (adjusted for ties) 


17.10 


Minitab 输出 给 出 了 每 个 样本 的 中 位 数 ,总 体 中 位 数 差 的 点 估计 以 及 置信 区 间 , 第 一 个 变 基 (此 
例 中 为 上 午 班 ) 的 秩 和 , 单 边 检验 的 广 值 =0.0348. 因 为 0.0348<0.05( 显 著 性 水 平 ), 所 以 拒绝 零 假 
设 , 即 认为 上 午 班 比 下 午 班 差 . 当 水 平 为 0.01 时 ,不 能 得 到 此 结论 , 因为 产值 大 于 0.01. 
运用 (a) 本 章 的 公式 (2), (b) 计数 方法 ( 详 见 本 章 注 4) 计 算 表 17.13 ЖШ U. 
E EF (а) 把 表 17.13 的 数据 按 递增 顺序 排列 ,并 标 出 其 秩 , 见 表 17.14. 用 秩 来 替换 表 17.13 相 
应 数据 ,得 到 表 17.15, 其 中 R =5, Rs,=10. 因 为 N=2,N,=3, 样 本 1 的 UU 值 为 


ММ +1 
U=NNt ОЧ в -2x3+2x3- 


样本 2 的 U 值 用 同样 方法 得 到 为 U =2. 





5=4 


Ж 17.13 Ф 17.14 






数据 |10 14 17 22 25 





样本 2117 25 14 





(b) ИТ, ПЯ Ж 17.14 中 的 样本 值 ,来 自 样本 1 的 用 工 蔡 换 , НИ ПЕ A 17.14 的 第 
一 行 变 为 


由 此 可 看 出 
样本 2 第 一 个 观测 值 前 样本 1 的 个 数 =1 
样本 2 第 二 个 观测 值 前 样本 1 的 个 数 = 1 
样本 2 第 三 个 观测 值 前 样本 1 的 个 数 =2 
总 数 =4 
因此 对 应 于 样本 1 的 17 值 为 4. 
同 理 可 知 
样本 1 第 一 个 观测 值 前 样本 2 的 个 数 =0 
样本 1 第 二 个 观测 值 前 样本 2 的 个 数 =2 


总 数 =2 
因此 对 应 于 样本 2 的 上 U 值 为 2. 


因为 №, =2, N;= 3, 因 此 这 些 值 满足 Uj+ U= NIN,, 即 4+2=2x3=6. 
一 总 体 包 含 三 个 元 素 :7, 12, 15. 无 放 回 地 从 该 总 体 中 抽取 两 个 样本 , 样本 1 包含 一 个 
元 素 ; 样 本 2 包含 两 个 元 素 (两 个 样本 正好 用 完 总 体 ). 
(a) 写 出 U 的 抽样 分 布 ,并 绘制 图 形 . 
(b) 与 出 U 的 均值 与 方差 . 
(c) 利用 本 章 公 式 (3) 验 证 (b) 的 结论 . 


解 E (а) 采用 无 放 回 抽样 是 为 了 避免 结 的 出 现 .此 时 有 3x2=6 种 抽样 方式 , 如 表 17.16 所 


不 ,用 秩 1,2,3 来 替换 7,12,15. 表 17.16 的 U 值 是 对 应 于 样本 1 的 ,对 于 样本 2 来 说 , 分布 也 是 一 
样 . 


表 17.16 





17.11 





此 分 布 的 图 形 如 图 17-4 所 示 , 其 中 广 表示 频数 . U 的 概率 分 布 图 也 能 如 此 绘制 .其 中 PLU= 0) = 
P(U=1)=P(U=2)= 二 .其 图 形 与 图 17-4 相同 ,只 不 过 纵 轴 上 的 1 与 2 分 别 用 右 与 地 替换 
(b) № 17.16 可 得 到 均值 与 方差 


_2+2+1+1+0+0_, 





Hu 6 
2 (2 1)2 + (2 1)2 + (1 1)2 + (1 1)2 + (0 1)2 + (0 -1)2 2 
(с) 由 公式 (3) 
NN, 1x2 _ 
Ру ё 725 2 ^1 
2 NiNzCNI+ Naz+1l) 1x2x(1+2+1) 2 
ус 12 = 12 3 


结果 与 (b) 中 结果 一 样 . 
(а) 写 出 习题 17.9 中 U 的 抽样 分 布 ,并 绘制 图 形 ; 
(b) 绘制 U 的 概率 分 布 图 ; 
(с) 直接 从 (a) 结 论 写 出 U 的 均值 与 方差 ; 
(d) 利用 本 章 公式 (3) 验 证 (c) 的 结论 . 
E F (а) 此 例 中 有 5x4x3x2=120 种 抽样 方式 ,习题 17.9 的 方法 计算 工作 量 太 大 , 为 了 简 
化 计算 , 把 重点 放 在 容量 较 小 的 样本 (Ni =2) 及 可 能 的 秩 和 R,. 当 样本 1 包含 秩 (1,2) 时 , 其 秩 和 最 
小 , R1=1+2=3. 同 理 , 当 样 本 1 包含 秩 (4,5) 时 , 秩 和 最 大 为 R=4+5=9. 因 此 可 知 R 可 从 3 变 
动 到 9. 

Ж 17.17 的 第 一 列表 示 秩 和 R (A 3 到 9), 第 二 列表 示 相 应 的 样本 1 的 秩 , 其 和 为 R,, 第 三 列 
给 出 了 样本 1 的 频数 .例如 秩 R=5 时 , f=2. 因 为 Ni1=2,N,=3, 所 以 


МСМ, +1 
U= мум + МУО в -2x3+2x3 





- Ку = 9 - К; 


由 此 我 们 可 知 表 17.17 的 第 四 列 为 相应 的 U 值 . 当 R 从 3 变动 到 9 时 , U 从 6 变动 到 0. 抽样 分 
布 由 第 三 列 及 第 四 列 得 到 ,图 17-5 为 其 图 . 
(b) U=9 К, 的 概率 ( 即 P(U=9- Ri)) 见 表 17.17 的 第 五 列 ， 通过 频率 得 到 .频率 为 频数 除 以 


总 频数 (或 10) 得 到 , P(UJ = 4) = 4 =0.2. 图 17-6 为 概率 分 布 图 . 


P(U =) 





3 | a» li s| 0 
4 | a | 1T |; 0.1 
5 0.2 
6 | asea | 2 | 3 0.2 
7 | ese» | 2 |; | 03 
в | __(з35›__ |1 | [| vi 
9 | 4 | Со | oi 


(с) 从 表 17.17 的 第 三 列 与 第 四 列 知 
эү _ 1Х6+1х5+2х4+2х3+2х2-1х1+1х0 _, 











во =U = Sy 1+1+2+2+2+1+1 
> >, fU -UY 
G = 
U У\; 
„1X (6-3) +1 (5-3) +2x (4-3)? +2033) +2х (2-32 +1x (1-3)? +1x (0-3 _, 
| 10 
另 解 
а^, = U’ – U’? 
1х62 +1х52 +2 х 42 +2 х 32 +2022 61х12 + 1х 02 323 
一 10 一 一 
(d) 由 公式 (3), 利 用 Ni=2, N,=3, 可知 
№№ _ 2x3_，, 
ÉU 2 2” 
2 МАМАМ М1) 2x3x6_ 3 
U 12 12 
17.12 ”假定 一 序列 从 1 变动 到 N, 证 明 其 秩 和 为 NY+D. 
ШЕ EF 邻 R 为 秩 和 , 则 
R=l1+2+3+…+(N-1D)+N (16) 
R=N+(N-1)+(N-2)+-+2+1 (17) 
其 中 (17) 是 通过 改变 (16) 的 求 和 顺序 得 到 . (16), (17) 式 两 边 各 项 相 加 , 则 有 


R= MN+D 
С 2 


17.13 В Ri, Ra 是 U 检验 中 样本 1 和 样本 2 的 秩 和 ,证 明 Ri + Ra= AED 


证 明 & 假定 样本 中 没有 结 点 , 那么 К, 必定 为 数 集 1,2,…, N 中 某 些 数 之 和 , к, 是 余下 的 数 
之 和 .因此 Ri+ Rs 一 定 为 1,2,…,N 之 和 , 即 Ri+t Ra=1+2+ м МОУ. 


Kruskal-Wallis H 检验 


17.14 某 公 司 想 购 买 机 器 A, В,С,р,Е 2. 5 个 熟练 工人 分 别 在 各 个 机 器 上 工作 相等 
时 间 以 判断 5 台 机 器 在 产 出 上 是 否 存 在 差异 . 表 17.18 是 相应 的 产品 数 .在 显著 性 水 
平 (a)0.05，(b) 0.01 下 检验 假设 Ho: 机 器 间 不 存在 差异 . 先 用 手 算 进行 Kruskal Wal- 
lis U 检验 ,然后 用 Minitab Ж. 
解 F 因为 有 5 个 样本 (A, B,C,D,E), 所 以 Ё = 5. 义 因为 每 个 样本 包含 5 个 数据 ,所 以 N = 
№= №= Ns= Ns=5,N= № + М, + № + Ns+ Ns=25. 把 25 个 数据 按 递增 顺序 排列 , 确定 其 秩 ， 


用 表 17.19 替 换 表 17.18, 它 的 最 后 一 列 为 秩 和 . 从 表 17.19 中 可 看 出 R= 70, R = 48.5, Р, = 93, 
R4=40.5$,R:=73. 因 此 


17.18 


СІЕЯ 
rzs 





KAKS 
ss | és | 





12 点 R? 
= 一 一 -人 一 -3(N+1 
H N(N +1) 2 М, ( ) 


2 2 2 2 2 
= 12561 05 + Т н 5 ta 13) -3x26= 6.44 


在 显著 性 水 平 0.05 Т, Н 服从 自由 度 为 &-1=4 的 xX” 分布. 从 附录 于 知 y? ,,(4) =9.49 .因为 
0.44<9.49, 不 能 拒绝 零 假 设 , 即 在 水 平 为 0.05 时 各 机 器 间 无 差异 .当然 水 平 为 0.01 时 , 更 不 能 拒 
注意 ， 我 们 曾 用 方差 分 析 的 方法 计算 过 此 问题 (见习 题 16.8), 结论 一 致 . 
Minitab 求解 过 程 如 下 . 先 把 数据 以 堆栈 的 形式 输入 到 工作 表 中 ， 结构 如 下 : 


Row Machine Units 
1 68 
2 1 72 
3 1 77 
4 1 42 
5 1 53 
6 2 72 
7 2 53 
8 2 63 
9 2 53 
10 2 48 
11 3 60 
12 3 82 
13 3 64 
14 3 75 
15 3 72 
16 4 48 
17 4 61 
18 4 57 
19 4 64 
20 4 50 
21 5 64 
22 5 65 
23 5 70 
24 5 68 
25 5 53 


Minitab 命令 Kruskal-Wallis ‘Units’ ‘Machine’ 可 得 到 如 下 输出 
MTB> Kruskal-Wallis ‘Units’ ‘Machine’. 

Kruskal-Wallis Test 

Kruskal-Wallis Test on Units 


Machine N Median Ave Rank Z 
1 5 68.00 14.0 0.34 
2 5 53.00 9.7 — 1.12 
3 5 72.00 18.6 1.90 
4 5 57.00 8.1 — 1.66 
5 5 65.00 14.6 0.54 
Overall 25 13.0 


H=6.44 рЕ=4 Pp=0.168 
H=6.49 DF=4 P=0.165(adjusted for ties) 
(Ж, 结论 中 给 出 了 两 个 p, 其 中 一 个 是 因 为 结 点 而 进行 调整 之 后 的 p 值 . 显然 ,无 论 显 著 性 水 
平 为 0.05 还 是 0.01, 机 器 间 都 不 会 存在 显著 差异 ， 因为 两 个 p- 值 都 远大 于 0.05 及 0 0] 
17.15 对 结 点 进行 修正 后 , 再 求解 习题 17 14. 


E SF 表 17.20 列 出 了 有 结 点 的 观测 值 结 点 的 个 数 .例如 ,48 出 现 了 2 次 , 故 了 =2;53 出 现 了 4 
次 , 故 工 =4. 计 算 所 有 的 Т?— 了, 然后 求 和 ,得 到 >'(T3-T)=6+60+24+6+24 = 120, 如 表 
17.20 所 示 . 又 因为 N =25, 所 以 修正 因子 为 


2CT-T 120 
М-М 7 25? — 25 





1 = 0.9923 


修正 后 的 HEX 





此 修正 并 未 改变 习题 17.14 所 得 的 结论 . 





- Т) = 120 


17.16 Ж17.21 是 过 去 一 年 内 教师 、 律 师 以 及 医生 ( 均 为 随机 选择 ) 租 借 的 CD 数 , 用 Minitab 
的 Kruskal-Wallis H 检验 , 在 水 平 0.01 下 ,对 和 零 假设 .三 种 职业 租借 CD 数目 的 分 布 相 
同 进行 检验 . 





R EF 把 数据 按 堆栈 形式 输入 到 工作 表 中 , 各 列 分 别 记 为 Rentals 和 Profession. 命令 Kruskal- 


Wallis 产生 如 下 输出 .其 中 p- 值 为 0.638, 此 数值 相当 大 ， 蕊 告诉 我 们 三 种 职业 租借 CD 数目 在 分 布 
上 不 存在 差异 . 
MTB> Kruskal-Wallis ‘rentals’ ‘Profession’ ; 


Kruskal-Wallis Test 


Profession N Median Ave Rank Z 
1 18 19.00 28.9 0.47 
2 20 18.50 28.7 0.44 
3 16 14.00 24.4 -0.95 
Overall 54 27.5 
H=0.90 DF=2 P=0.638 
H=0.90 DF=2 P = 0.638 (adjusted for ties) 
随机 性 的 游程 检验 


17.17 96—01 30 次 ,得 到 由 正面 (HH) 与 反面 (T) 组 成 的 序列 
HTTHTHHHTHHTTHTHTHHTHTTHTHHTHT 
(а) 计算 游程 数 V. 
(b) 在 显著 性 水 平 0.05 F, 检验 假设 五: 此 序列 是 随机 的 . 
先 用 手 算得 到 随机 性 的 游程 检验 , 然后 再 用 Minitab 求解 . 


解 F (a) 用 竖 线 将 各 个 游程 分 离 ,得 到 


HITTIHIT'HHHITIHH!ITTIH!ITIH|ITIHH 
ITIHITTIHITIHHITIHIT!I 
可 看 出 ,游程 数 V = 22. 
(b) 序列 中 出 现 Ni = 16 个 正面 , М, = 14 个 反面 ,由 (a) 知 游程 数 V = 22. 因 此 利用 本 章 的 公式 (13) 
ШЕЛ: ЕЗ 
_2х16х14 
#V © 16+14 
2X16 x 14x (2 x16x14- 16-14) _ 
2, = 2516 хх (2 6.x 14 16 М) 5 175 
或 nrv=2.679. 与 游程 数 V= 22 相对 应 的 z 值 为 


“二 pv _ 22—15.93 


б, 2.679 


这 是 一 个 双边 检验 问题 .在 水 平 0.05 下 ,车 一 1.96 之 z 达 1.96, 则 接受 假设 Ho, 认为 序列 是 随机 的 ， 
否则 拒绝 Ho( 见 图 17-7). 因 为 计算 得 到 的 = 值 为 2.27>1.96, 故 认为 在 水 平 0.05 F, HRTEM 
机 的 .此 检验 表明 游程 过 多 , 是 一 个 循环 模型 . 

假如 进行 连续 性 修正 , 则 > 值 为 


z= 22 - 0.5) - 15.93 ~ 2.08 


2.679 


+ 1 = 15.93, 





z = 


= 2.27 


结论 与 上 述 相 同 . 
Minitab 求解 过 程 如 下 . 数据 按 列 输入 ,正面 用 1 来 表 
л\, ФИ Н 0 表示 . 列 用 Coin 来 表示 . Minitab 命令 Runs 






‘Coin’ 即 可 得 到 如 下 输出 
面积 =0.025 J . 面积 = () 095 MTB > Runs * Coin’ ; 
A | А Runs Test 
элү T ' Coin 
K= 0.5333 


图 17-7 


The observed number of runs = 22 
The expected number of runs = 15.9333 


16 Observations above K 14 below 
The test is significant at 0.0235 
K 值 是 数据 列 中 0 和 1 的 均值 .高 于 或 低 于 К 的 观测 值 数 目 分别 为 正面 和 有 反面 出 现 的 次 数 . 
广 值 为 0.0235. 它 是 零 假设 被 拒绝 的 最 小 显著 性 水 平 ,因此 在 水 平 0.05 F, 可 看 出 零 假设 被 拒绝 . 


17.18 PLAE 48 个 工具 按 如 下 顺序 排列 .其 中 С 表示 合格 品 ,D 表示 次 品 . 


17.19 


EI 


G G G G G G DD DG GG GGGGGG 
G G D D D D G G G с с ср б С С 
G G G G G G D D G G G GG DG G 
在 显著 性 水 平 0.05 下 对 序列 进行 随机 性 检验 . 
Ж EE D 和 G 的 个 数 分 别 为 Ni = 10, №, = 38, 游程 数 V =11. 均 值 和 方差 为 


_2x10x 38 
Ву 10+38 


52 _ 2X10 х 38 х (2х 10 х 38 – 10 - 38) — 4.997 


У (10 + 38)2(10 + 38 – 1) 


+ 1 = 16.83 


因此 cv = 2.235. 
这 是 一 个 双边 检验 问题 . 在 水 平 0.05 Е, 车 - 1.96< :<<1.96, 则 接受 假设 Ho, 认为 序列 是 随 
机 的 ;否则 拒绝 五 0( 见 图 17-7) .因为 与 游程 数 =11 相对 应 的 z 值 为 


YA 11-16.83 _ 
= сү Е 2.235 = — 2.61 


-2.61< 一 1.96, 故 在 水 平 0.05 下 ,拒绝 Ho. 
此 检验 表明 游程 过 少 , 对 于 次 品 好 像 存在 趋势 模型 . 对 此 序列 进行 的 深 一 步 的 检验 保证 了 此 结 
论 的 成 立 . 
(a) 与 出 由 3 个 a,2 个 b 形 成 的 所 有 可 能 序列 , 并 给 出 每 个 序列 的 游程 数 V. 
(b) Bib V 的 抽样 分 布 , 并 绘制 图 形 . 
(с) 与 出 Y 的 概率 分 布 , 并 绘制 图 形 . 
Ж EF (a) staz tomua] ;| = 区 有 =10 个 序列 , 见 表 17.22, 它 还 提供 了 相应 的 游程 
Ж. 
(b) V 的 抽样 分 布 见 表 17.23( 从 表 17.22 得 到 ) , 其 中 V 表示 游程 数 , f 表示 频数 .相应 的 图 表 见 图 


17-8. 
(с) V 的 概率 分 布 见 图 17-9, 由 表 17.23 得 到 , 其 中 频率 等 于 频数 除 以 总 频数 2+ 3+4+1=10 的 


商 . 例 如 P(V=5)= 16 =0.1. 





Æ 17.22 Ж 17.23 
游程 数 (V) 









м 








w È ù A A A mm oo D m 
a > Б A Сс б A Б сз ст 





T бе с з А Ко б б А У 
Б б вооон р 9 
Б 5 б Б A се Бо о су су Б 
Ф шо & N A фуу л ш Ф 





17.20 直接 写 出 习题 17.19 游程 数 V 的 (a) 均值 ,(b) 方差 


解 EF (a) 从 表 17.22 知 


2+4+3+5+3+4+2+4+3+4 17 
ну 10 5 





男 解 





= МУ _2х2+3х3+4ха4+1х5 17 
у У\у 2+3 +4 +1 5 


Р( у =?) 





图 17-8 图 17-9 


(b) 从 表 17.22 Я 


2 DSV- У) 
бү = 
Уу 
_ 1 17\? у 17|? 17}? 17) 12 
- 11252-0) кзх (3-2 | +4x|4- 1| +1х[5- 7) = 5 
PR 
2 _ i 2X2+3x3+4x4+1x5 (17|? 21 
ov V-V = 10 217) 25 
17.21 利用 本 章 公 式 (13) 计 算 习 题 17.20. 
解 БЕ 因为 有 3 个 a,2 个 b, 所 以 Ni1=3,N,=2. 因 此 
(a) 
2NIN, _2х3х2 _ 17 
"v= N +N, l 3+2 775 


(b) 
2N i Na(2N N2 - № - N2) 
(№, + №,)2(№ + М, – 1) 


2х3х2х(2х3х2-3-2) _ 21 
(3+ 2)2(3 +2 – 1) 25 


2 _ 
бұ = 


游程 检验 的 进一步 应 用 


17.22 见习 题 17.3, 在 水 平 0.05 F, 判断 PQR 公司 生产 的 电池 寿命 的 样本 序列 是 否 随 机 ? 
AER 17.3 的 数据 按 行 排列 , 即 第 一 个 数据 为 217, 第 二 个 数据 为 230,…, 最 后 一 个 
数据 为 268. 先 用 手 算 方 法 进行 随机 性 的 游程 检验 ,再 进行 Minitab 分 析 . 


解 F 表 17.24 以 递增 次 序 对 电池 寿命 进行 了 排列 .因为 有 24 个 输入 数据 ,所 以 中 位 数 为 中 间 


两 个 数据 (253 和 262) 的 均值 ， BP- (253+ 262) = 257.5. ER 17.3 的 数据 高 于 中 位 数 , 则 用 а 来 表 
示 , 者 低 于 中 位 数 ,用 b 表示 ,这 样 就 得 到 表 17.25, 其 中 有 12 个 a, 12 个 b. 因 此 Ni = 12, №, = 12， 
М =24,‚ У = 15,& 


_ 2№№ _ 2х12х12 
fv Ni+ №, 7 102+ 12 


2 _ 2х 12х12 х 264 
бұ = 2 
24° х 23 


+1 = 13 


= 5.739 
因此 


在 水 平 0.05 下 进行 双边 检验 , #7 -1.96 达 z 达 1.96, 则 接受 假设 Ho 认为 序列 是 随机 的 ;否则 拒绝 
Ho. 因 为 0.835 未 超出 此 范围 ,因此 我 们 认为 样本 是 随机 的 . 


17.23 


秩 相 关 


17.24 


Ж 17.24 表 17.25 


198 211 216 219 224 225 230 236 a b b a a b a 


243 252 253 253 262 264 268 271 
272 275 282 284 288 291 294 295 


Minitab 求解 过 程 如 下 .数据 按照 收集 的 顺序 按 列 输 入 , 此 列 用 Lifetime 来 表示 . 中 位 数 由 命令 
Median cl 计算 , 等 于 257.5. Minitab 命令 Runs 257.5“Lifetime" 即 可 得 到 如 下 输出 . p- 值 为 0.4038. 
因此 在 水 平 0.05 下 , 零 假 设 不 能 被 拒绝 . 

Lifetime 

271 230 198 275 282 225 284 219 253 
216 262 288 236 291 253 224 264 295 
211 252 294 243 272 268 

MTB> Median с1; 

Column Median 

Median of Lifetime = 257.50 

MTB > Runs 257.5 ‘lifetime’. 

Runs Test 

Lifetime 

K= 257.5000 

The observed number of runs = 15 

The expected number of runs = 13.0000 

12 Observations above K 12 below 

The test is significant at 0.4038 

Cannot reject at alpha = 0.05 


用 随机 性 的 游程 检验 求解 习题 17.5. 
BO F 从 两 个 样本 获得 的 数据 已 排 在 表 17.8 的 第 一 行 ， 用 符号 ab 分 别 表示 取 自 样本 工 、 伴 本 
[的 数据 , 则 表 17.8 的 第 一 行 变 为 
b bb bb bb Ь а а а а а Ъ ba a a 
因为 有 4 个 游程 , 故 Nj = 8, N,=10,V=4. 因 此 


_ 2№М№ |) 2x8xlo ,_ 
пу ум, 1 = ig +1 = 9.889 


„2 = NNQNN; - N, ~ №) _ 2x8x 10 х 142 


У (NI + N,) (N, + N – 1) 182 х 17 = 4.125 


Улу _ 4-9. 889 
Z= a, T 2o, 77290 


E Ho 表示 合金 之 间 无 差异 , 它 亦 表 示 上 述 序列 是 随机 的 EKF 0.05 下 进行 双边 检验 , # -1.96 
全 z 全 1.96, 则 接受 假设 Ho, 认为 序列 是 随机 的 ;否则 拒 弧 万 o. 因 为 -2.90 超出 此 范围 ,因此 我 们 拒 
绝 Ho, 得 到 与 习题 17.5 一 致 的 结论 . 
知 进行 连续 性 修正 , 则 
_ Уну _ (4+0.5) -9.889 
„= e _ (4+ з) е 889__ 65 
结果 不 变 . 


R 17.26 列 出 了 根据 10 个 学 生 ( 按 字母 顺序 排列 ) 和 名 自 生物 课 的 实验 成 绩 与 讲授 课 的 
成 绩 而 构成 的 排序 表 ( 即 秩 ). 写 出 秩 相 关系 数 . 


实验 课 8 3 9 2 7 10 4 6 1 5 
讲授 课 9 5 10 1 8 7 3 4 2 6 


解 S 每 个 学 生 实验 课 与 讲授 课 的 秩 差 D 见 表 17.27, 其 中 也 给 出 了 DA DD. 因此 


6D? 6x24 
O N(N?-1) 10(102 – 1) 
表明 在 生物 课 的 实验 部 分 与 讲授 部 分 有 明显 的 相关 性 . 


= 1 = 0.8545 


家 17.27 





17.25 X 17.28 给 出 12 对 父亲 与 其 大 儿子 (成 年 ) 的 身高 . 写 出 秩 相关 系数 . 先 用 手 算 求解 
秩 相关 系数 ,再 用 Minitab 求解 . 


Ж 17.28 


父亲 身高 (英寸 ) 65 63 67 64 68 62 70 66 68 67 69 71 
儿子 身高 (英寸 ) 68 66 68 65 69 6 68 65 71 67 68 70 


МО > 父亲 身高 按 递 增 顺 序 排列 为 
62 63 64 65 66 67 67 68 68 69 70 71 (18) 


上 述 数组 中 第 六 七 位 置 上 身高 相同 (得 为 67 英寸 ), 则 他 们 的 秩 为 二 (6+ 7) = 6.5, 同 理 ,第 八 \ 九 
位 置 上 身高 相同 (党 为 68 英寸), 则 他 们 的 秩 为 广 (8+9) = 8.5. 因 此 父亲 身高 的 秩 排列 为 


1 2 3 4 5 6.5 6.5 8.5 8.5 10 11 12 (19) 
同 理 , 儿子 身高 按 递增 顺序 排列 为 
65 65 6 66 67 68 68 68 68 69 70 71 (20) 
上 述 数 组 中 第 六 、 七 `\ 八 和 九 位 置 上 身高 相同 ( 皆 为 68 ЗЕЕ), 则 他 们 的 秩 为 (6+7+8+9) = 7.5. 
同 理 , 因此 儿子 身高 的 秩 排列 为 
1.5 1.5 3.5 3.5 5 7.5 7.5 7.5 7.5 10 11 12 (21) 


考虑 (18) 和 (19), (20) 和 (21), 可 用 表 17.29 #5 17.28. 表 17.30 给 出 了 秩 差 D, UK р? 
和 `D. 因此 得 知 


62,D? | _ _6x 72.50 


rs EVEEN 727120122 - 1) 


= 0.7465 
17.29 


父亲 身高 的 秩 4 2 6.5 3 8.5 1 11 5 8.5 6.5 10 12 
儿子 身高 的 秩 | 7.5 35 75 1.5 10 3.5 7.5 1.5 12 5 7.5 11 









D | -3.5 ~1.5 -1.0 1.5 -1.5 -2.5 3.5 3.5 -3.5 1.5 






12.25 2.25 1.00 2.25 2.25 6.25 12.25 12.25 12.25 2.25 6.25 1.00 >р? 





= 72.50 


此 结论 和 其 他 方法 得 到 的 相关 系数 一 致 (见习 题 14.9,14.14,14.16 和 14.23). 
Minitab 求解 过 程 如 下 .父亲 身高 和 儿子 身高 在 Minitab 工作 表 中 各 为 第 一 列 与 第 二 列 ,分 别 记 
为 Father 和 Son. 


Row Father Son 
1 65 68 
2 63 66 
3 67 68 
4 64 65 
5 68 69 
6 02 66 
7 70 68 
8 66 65 
9 68 71 
10 67 67 
11 69 68 
12 71 70 


身高 的 秩 分 别 输入 到 c3 列 及 c4 列 ， 
MTB > rank cl put into сЗ 

MTB > rank с2 put into c4 
MTB > print cl-c4 


Row Father Son C3 C4 
1 65 68 4.0 7.5 
2 63 66 2.0 3.5 
3 67 68 6.5 7.5 
4 64 65 3.0 1.5 
5 68 69 8.5 10.0 
6 62 66 1.0 3.5 
7 70 68 11.0 7.5 
8 66 65 5.0 1.5 
9 68 71 8.5 12.0 
10 67 67 6.5 5.0 
11 69 68 10.0 7.5 
12 71 70 12.0 11.0 


用 Minitab 命令 correlation c3 c4 计算 秩 相 关系 数 ， 

MTB > correlation c3 c4 

Correlations{ Pearson ) 

Correlation of c3 and c4 = 0.740, Р-Уаше = 0.006 

产值 0.006 可 用 来 对 零 假设 (总 体 的 秩 相关 系数 为 0) 及 备 择 假设 (总 体 的 秩 相关 系数 不 为 0) 进 行 
检验 .因此 我 们 认为 父亲 与 儿子 身高 上 存在 相关 性 . 


te % 20 A 
符号 检验 


17.26 某 公司 宣 称 若 在 汽车 油箱 里 加 上 他 们 生产 的 产品 ， 每 加 仑 汽油 行驶 的 里 程 数 将 会 提高 .为 了 证 明 它 的 
有 效 性 ,挑选 了 15 辆 不 同 的 汽车 ,记录 下 其 在 增加 该 产品 与 不 增加 该 产品 下 每 加 仑 汽油 行驶 的 里 程 


数 ,结论 见 表 17.31. 假 定 行驶 条 件 相同 ,在 显著 性 水 平 (a) 0.05, (b) 0.01 下 判断 是 否 会 由 于 增加 该 
产品 而 引起 行程 的 差异 . 


$ 17.31 
增加 | 34.7 28.3 19.6 25.1 15.7 24.5 28.7 23.5 27.7 32.1 29.6 22.4 25.7 28.1 24.3 
不 增加 | 31.4 27.2 20.4 24.6 14.9 22.3 26.8 24.1 26.2 31.4 28.8 23.1 24.0 27.3 22.9 


17.27 ÆKF 0.05 F, 对 于 习题 17.26, 你 是 否 能 断定 增加 该 产品 后 每 加 仑 汽油 行驶 的 里 程 数 要 比 原 来 高 ? 

17.28 某 减肥 俱乐部 在 广告 上 说 , 若 按照 它 设 计 的 特别 课程 去 减肥 , 一 个 月 体重 将 减少 至 少 6% .为 了 对 此 
进行 验证 ,36 个 成 人 参加 了 此 培训 ,其 中 有 25 个 人 达到 广告 上 说 的 效果 ,6 人 体重 增加 , 其 他 人 保持 
不 变 .在 显著 性 水 平 0.05 下 判断 此 课程 设计 是 否 有 效 ? 

17.29 某 公司 培训 部 经 理 认 为 , 若 对 其 销售 员工 进行 特别 培训 , 公司 的 年 销售 额 将 会 增加 .为 了 对 此 进行 验 
证 ,24 人 参加 了 培训 ,其 中 16 人 的 销售 额 提 高 ,6 人 下 降 , 2 人 保持 不 变 . 在 显著 性 水 平 0.05 下 判断 
此 特别 培训 是 否 增 加 了 公司 的 销售 额 ? 

17.30 MW Soda 公司 为 了 检验 公众 对 两 种 品牌 可 乐 A ЖП В 的 相对 喜欢 程度 , 在 全 国 27 个 地 区 进行 了 “ 品 
ж”. ДАР 8 个 地 区 品牌 A 受 欢 迎 ,17 个 地 区 品牌 В 受 欢迎 ,其 他 地 区 两 者 皆 可 . 在 显著 性 水 平 
0.05 下 ,你 能 否 断 定 品牌 В ША 更 受 欢 迎 ? 

17.31 ”随机 从 茶 公 司 生产 的 绳子 中 抽取 了 25 根 测 量 其 断裂 强度 ,结果 见 表 17.32. 据 此 样本 , 在 显著 性 水 平 
0.05 下 分 别 检验 该 公司 的 声明 , 即 绳子 的 断裂 强度 为 (a) 25, (b) 30, (с) 35, (d) 40. 





表 17.32 
41 28 35 38 23 
37 32 24 46 30 
25 36 22 41 37 
43 27 34 27 36 
42 33 28 31 24 





17.32 说 明 怎样 计算 习题 17.4 数据 的 95% 置信 限 ? 
17.33 设计 一 试验 ,并 用 符号 检验 方法 求解 . 


Mann-Whitney U 检验 


17.34 XYZ 大 学 讲师 A 和 B 均 担任 某 门 基础 化 学 的 主讲 教师 ， 菜 次 期 末 考 试 学 生 的 成 绩 见 表 17. 33. 在 显 
著 性 水 平 0.05 下 检验 假设 :讲师 A 和 B 的 学 生 的 成 绩 不 存在 差异 ， 


表 17.33 


17.35 见习 题 17.8, 在 显著 性 水 平 0.01 下 ， 能 否 断 定 上 午 班 学 生 的 成 绩 比 下 午 班 差 ? 
17.36 某 农民 想 了 解 两 个 品种 的 小 麦 T 、 了 本 产量 上 是 否 存 在 区 别 . 表 17_34 展示 了 单位 面积 上 各 个 品种 小 麦 
的 产量 .分 别 在 显著 性 水 平 (а) 0.05, (Ь) 0.01 下 判断 两 个 品种 闻 是 否 存 在 差别 ? 


表 17.34 





ЛУ [| 15.9 15.3 16.4 14.9 15.3 16.0 14.6 15.3 14.5 16.6 16.0 






Т^ Ш 16.4 16.8 17.1 16.9 18.0 15.6 181 172 15.4 





17.37 见习 题 17.36, 在 显著 性 水 平 0.05 F, 此 农民 能 否 断 定 小 麦 [[ 产量 比 小 麦 ? 
17.38 茶 公 司 希 望 了 解 两 种 品牌 汽油 A MB 每 加 仑 的 行驶 里 程 是 否 有 区 别 . 17.35 给 出 B PE da AE PA W 
每 加 仑 的 行驶 里 程 数 .在 显著 性 水 平 0.05 F, 判断 (a) 两 个 品牌 间 是否 存 在 差异 ? (b) 品牌 B 是 否 


比 品 牌 A 要 好 ? 


表 17.35 






30.4 28 7 292 32.5 31.7 295 30.8 31.1 30.7 31.8 
33.5 298 30 1 314 338 309 31.3 29.6 32.8 33.0 





17.39 EEH URAXE 17.1 中 的 机 器 工 和 机 器 正之 间 是 否 存在 差异 ? 请 解释 . 
17.40 ”设计 一 试验 ,并 用 U 检验 方法 求解 . 

17.41 分 别 用 (a) 公式 法 , (Ь) 计数 方法 来 计算 表 17.36 数据 的 统计 量 U. 

17.42 以 表 17.37 的 数据 替换 表 17.36 的 数据 ,求解 习题 17.41. 


Ж 17.36 表 17.37 
样本 1 15 25 样本 1 
样本 2 20 32 样本 2 


17.43 ЖЮК 2,5,9 和 12 四 个 值 组 成 .从 此 总 体 中 抽取 了 两 个 样本 ,第 一 个 样本 包含 一 个 值 ,第 二 个 祥 
本 由 剩余 的 三 个 值 组 成 . 
(а) 计算 U 的 抽样 分 布 并 绘制 图 形 . 
(b) 计算 此 分 布 的 均值 和 方差 , 分 别 用 公式 及 直接 计算 . 

17.44 证 明 0, +0, = №, №,. 


17.45 ”在 结 点 数 分 别 为 (a) 1, (b) 2, (с) 任意 数 的 情况 下 证 明 R + R, = AN 


17.46 Ж №, =14, Ni=12,RIi=105, 计 算 (a)R,(b)DUi,(c)D2， 
17.47 Ж М,=10,ММ»=16, 07, = 60, Ж. (а) ЕЁ, (Ь)Р,, (c) U]. 
17.48 Ж Ni, Nao Ro Ro Ul 和 О, Ф, Ж АХ {И ERUERA ИД? 给 出 证 明 





Kruskal-Wallis H 检验 


17.49 用 某 试验 来 检验 5 个 不 同 品 种 的 小 麦 A,B,C,D 和 EE 的 产量 是 否 有 区 别 . 每 一 品种 分 别 种 植 在 4 块 
地 上 .产量 (蒲式耳 /英亩 ) 见 表 17.38. 假 设 土壤 肥沃 度 相 同 且 每 个 品种 随机 地 种 植 在 某 块 地 中 .在 显 
著 性 水 平 (a) 0.05, (Ь)0.01 下 判断 各 品种 小 麦 的 产量 间 是 否 存 在 差别 ? 


表 17.38 Ж 17.39 





17.50 某 公 司 想 对 四 种 轮胎 А,В,С Яр 进行 检验 .轮胎 的 寿命 (由 行驶 的 里 程 决定 , 单位 ; 干 英里 ) 见 表 
17.39. 每 种 轮胎 随机 地 应 用 在 6 辆 性 能 相同 的 汽车 上 .在 显著 性 水 平 (a) 0.05, (Ь) 0.01 下 判断 轮胎 
则 是 否 存 在 显著 差异 ? 

17.51 某 教师 想 对 三 种 教学 方法 IT 和 亚 进行 检验 .为 此 , 他 随机 选择 了 三 组 学 生 ( 每 组 5 人 ) 进 行 试验 ， 
每 组 学 生 采 用 一 种 教学 方法 .最 后 进行 统一 测试 ,成 绩 见 表 17.40. 在 显著 性 水 平 (a) 0.05,(Ь) 0.01 


下 判断 教学 方法 间 是 否 存在 差别 ? 
表 17.40 
方法 村 78 62 71 58 73 
方法 了 76 85 77 90 87 
方法 下 74 79 _60 75 80 


17.52 ”一 个 学 生 在 某 学 期 各 门 课 成 绩 见 表 17.41, 在 显著 性 水 平 (a) 0.05,(Ь) 0.01 下 判断 各 门 学 科 成 绩 间 


是 否 存在 差别 ? 


表 17.41 
数学 72 80 83 75 
科学 技术 81 74 77 
英语 88 82 90 87 80 
经 济 学 74 71 7 70 


17.53 ЖН, Ж (а) 习题 16.9, (b) 习题 16.21, (с) 习题 16.22. 
17.54 НН, Ж (а) 习题 16.23, (b) 习题 16.24, (с) 习题 16.25. 


随机 性 的 游程 检验 


17.55 计算 下 列 序 列 的 游程 数 V. 
(аб)уА В A В В А А А В В A В 
(bW) H H T H Н. Н Т Т Т Т. ОН Н THH Т. DT 
17.56 为 了 了 解 人 们 对 某 产品 的 喜 恶 (喜欢 用 Y 表示 , 不 喜欢 用 М 表示 ), 抽取 了 25 个 人 进行 试验 , 结果 见 
下 表 : 
Y Y NNNNY YY NY NN YN 
МОМ МОМ ҮҮ ҮҮ NN 
(а) 计算 序列 的 游程 数 V; 
(b) 在 显著 性 水 平 0.05 下 判断 回答 序列 是 否 随 机 ”? 
17.57 “对 本 章 序列 (10),(11) 进 行 游程 检验 , 并 写 出 结论 . 
17.58 (а) 与 出 由 2 个 a,1 个 6 组 成 的 所 有 座 列 ,并 计算 每 一 个 序列 的 游程 数 V. 
(b) 计算 V 的 抽样 分 布 并 绘制 图 形 . 
(с) 计算 V 的 概率 分 布 并 绘制 图 形 . 
17.59 对 习题 17.58, 分 别 用 (a) 直接 计算 , (b) 公式 的 方法 计算 V 的 均值 和 方差 . 
17.60 在 下 列 条 件 下 求解 习题 17.58 和 17.59. 
(а) 2 个 a,2 个 5;(b)1 个 4a,3 个 5;(c)1 个 4,4 个 5. 
‚ 17.61 在 下 列 条 件 下 求解 习题 17.58 和 17.59. 
(a)2 个 a,4 个 5 ;(b)3 个 a,3 个 6。. 


游程 检验 的 进一步 应 用 


17.62 在 显著 性 水 平 0.05 F, 判断 表 17.5 列 出 的 40 个 成 绩 序 列 是 否 随 机 ? 
17.63 RREH 25 天 的 收盘 价 见 表 17.42. 在 显著 性 水 平 0.05 下 ,判断 此 价格 是 否 随 机 ? 


表 17.42 
10.375 11.125 10.875 10.625 11.500 
11.625 11.250 11.375 10.750 11.000 
10.875 10.750 11.500 11.250 12.125 
11.875 11.375 11.875 11.125 11.750 
11.375 12.125 11.750 11.500 12.250 


17.64 v2 若 表示 成 小 数 形式 , 它 的 前 若干 位 为 1.41421 35623 73095 0488… . 从 数字 的 随机 性 考虑 , 你 能 得 
到 什么 结论 ? 

17.65 从 数字 的 随机 性 考虑 ,对 于 下 列 数值 你 能 得 到 什么 结论 ? 
(а) /3 = 1.73205 08075 68877 2935... 
(b) x = 3.14159 26535 89793 2643…. 


17.66 用 随机 性 的 游程 检验 求解 习题 17.30. 
17.67 用 随机 性 的 游程 检验 求解 习题 17.32. 
17.68 用 泗 机 性 的 游程 检验 求解 习题 17.34. 


秩 相关 


17.69 某 次 比赛 中 ,要 求 两 名 裁判 根据 其 欣赏 程度 对 8 名 选手 排 次 序 ( 从 1 到 8), 结果 见 表 17.43. 
(a) 写 出 秩 相 关系 数 . 
(b) 判断 两 名 裁判 在 他 们 判决 上 是 否 一 致 . 


表 17.43 
裁判 一 5 2 8 1 4 6 3 7 
裁判 二 4 5 7 3 2 8 1 6 


17.70 “用 秩 相 关 方 法 求解 : 
(а) 27 14.26, (Ь) 习题 14.42, (с) 习题 14.46, (d) 习题 14 .63， 

17.71 将 第 十 四 章 的 积 - 矩 相关 系数 公式 中 的 数据 排 秩 后 代替 原 数据 , 由 此 推导 出 秩 相关 系数 .用 两 种 方法 
求解 同一 问题 来 验证 它 . 

17.72 ”对 分 组 数据 能 写 出 秩 相 关系 数 吗 ?请 解释 , 并 用 实例 来 验证 . 


第 十 八 章 ”时 间 上 序列 分 析 


时 间 序 列 

一 个 时 间 序 列 是 一 组 在 特定 时 刻 (一 般 是 等 时 间 间 隔 ) 上 的 观测 值 .例如 ,美国 若干 年 内 的 
钢铁 的 年 产量 ,证 券 交 易 中 某 股票 的 日 收盘 价 ,城市 气象 局 按 小 时 发 布 的 气温 , 菜 商 店 的 月 销 
售 额 等 等 . 

从 数学 上 看 ,时 间 序 列 根 据 变 量 Y( 温 度 收盘 价 等 ) 在 不 同时 刻 11 ,zt,,… 的 值 Yi, Yao 
来 表示 , 因此 Y 是 关于 上 的 函数 ,用 符号 表示 即 YSF). 
时 间 序 列 图 


时 间 序 列 可 通过 构造 变量 Y 对 1 的 图 表 来 表示 .例如 ,图 18-1 就 是 反映 Desert Compact 
Discs And Cassettes Distribution 公司 压缩 光盘 季 和 销售 额 的 时 间 序 列 图 , 此 销售 数据 图 涉及 到 
1994 一 1997 的 各 个 季度 . 


250 


200 


销售 客 
S 





TT 一 
季度 1 23 41 234 123411234 
年 份 1994 1995 1996 1997 


图 18-1 DCDCD 公司 压缩 光盘 的 季 销 售 额 


时 间 序 列 的 特征 运动 


把 时 间 序列 图 看 作 是 一 个 描述 随时 间 而 移动 的 点 图 是 很 形象 的 , 如 图 18-1. 许 多 情况 下 ， 
它 类 似 于 一 个 粒子 在 力 的 作用 下 的 路 径 图 , 它 也 可 能 是 经 济 、 社 会 学 、 精 神 或 其 他 力作 用 下 的 
质点 的 路 径 图 . 

时 间 序 列 的 许多 实例 已 证 实 了 时 间 序 列 的 某 些 特征 运动 ,对 这 些 运动 的 分 析 有 很 大 价值 . 
例如 , 对 未 来 发 展 的 预测 等 等 . 难怪 许多 工业 及 政府 部 门 都 很 关注 这 门 重要 学 科 . 


时 间 序 列 运动 分 类 


时 间 序 列 的 特征 运动 一 般 可 分 为 四 大 类 , 常 称 之 为 时 间 序 列 的 运动 成 分 或 因素 . 

1. 长 期 运动 . 此 运动 是 指 时 间 序 列 的 长 期 发 展 趋势 .在 图 18-1 中 ,长 期 运动 (或 长 期 变 
差 、 长 期 趋势 ) 由 一 条 趋势 线 表示 , 即 用 虚线 连接 的 线 , 对 某 些 时 间 序 列 而 言 ,趋势 曲线 可 能 更 
合适 些 .第 十 三 章 已 通过 最 小 二 乘法 拟 合 了 趋势 线 及 趋势 曲线 , 本 章 后 面 还 将 介绍 其 他 方法 . 

2. 循环 运动 或 循环 变 差 . 此 运动 是 指 时 间 序 列 围 绕 趋 势 线 或 趋势 曲线 的 长 期 振动 或 摆 


动 .这 种 循环 运动 , 可 能 是 周期 的 , 也 可 能 不 是 ,也 就 是 说 , ТЕ ЗЕР] ЇН] ЇН] Кая а, 时 间 序 列 有 可 能 遵 
从 完全 相同 的 模型 ,也 可 能 遵从 不 完全 相同 的 模型 .在 商业 和 经 济 活动 中 , 仅 当 同样 性 质 的 事 
件 至 少 以 一 年 间隔 发 生 时 , 运动 才能 被 认为 是 循环 运动 .循环 运动 的 一 个 重要 例子 就 是 所 谓 的 
“经 济 循环 ”, 它 由 经 济 繁荣 、 衰 退 、 萧 条 、 复 苏 构 成 .从 图 18-1 的 趋势 线 来 看 , 循环 运动 表现 得 
很 明显 . 

3. 李 节 运动 或 季节 变 差 .此 运动 是 指 在 连续 几 年 相应 的 月 份 或 季度 , 时 间 序 列 模型 相同 
或 几乎 完全 相同 .此 运动 是 由 于 相同 事件 年 年 发 生 所 致 . 例如 圣诞 节 前 百货 商店 的 销售 额 剧 
增 .季节 运动 在 图 18-1 中 可 明显 看 到 :4 年 中 每 年 第 四 季度 的 销售 额 最 高 .尽管 在 商业 或 经 济 
理论 中 季节 运动 被 看 作 是 以 年 度 为 周期 的 ,但 其 思想 却 可 根据 数据 类 型 的 不 同 推广 到 任意 时 
同 间 隔 为 周期 的 时 间 序 列 中 (例如 以 天 、 小 时 、 星 期 为 周期 ). 

4. 不 规则 运动 或 随机 运动 . 此 运动 是 指 因为 偶然 事件 而 引起 时 间 序 列 的 随机 变动 . 像 洪 
水 ` 要 工 . 选 举 都 是 偶然 事件 .尽管 一 般 认 为 这 样 的 事件 只 会 引起 短 时 间 的 变化 , 但 它们 也 可 能 
导致 新 的 周期 或 其 他 运动 . 


时 间 序 列 分 析 


时 间 序列 分 析 就 是 对 目前 各 运动 成 分 进行 描述 (一 般 是 数学 描述 ) .为 了 对 此 有 所 了 解 ,看 
图 18-2, 它 展示 一 个 理想 的 时 间 序 列 . 图 18-2(a) 表 示 一 条 长 期 趋势 线 (而 非 趋 势 曲线 ), 图 
18-2(b) 表 示 此 长 期 趋势 线 上 至 加 一 循环 运动 (可 认为 是 周期 的 ), 图 18-2(c) 表 示 图 18-2(b) 上 再 
登 加 一 个 季节 运动 . 若 我 们 在 图 18-2(c) 上 亚 加 不 规则 或 随机 运动 看 起 来 和 实际 情况 更 相符 . 


了 





(a) 长 期 趋势 (b) 长 期 及 循环 运动 (О 长 期 ， 循 环 和 季节 运动 


图 18-2 


图 18-2 为 我 们 提供 了 一 种 分 析 时 间 序 列 的 方法 . 我 们 可 假设 时 间 序 列 变量 ү 是 变量 工 ， 

C,S, 了 的 乘积 ( 芽 , С, 8,1 分 别 表示 趋势 .循环 .季节 、 不 规则 运动 ), 即 
Y=TXCXSxI = TCSI (1) 

时 间 序 列 分 析 相 当 于 研究 因素 Т,С,5$,1, 因此 经 常 被 认为 是 把 一 个 时 间 序 列 分 解 成 它 
的 基本 运动 成 分 从 而 进行 分 析 的 过 程 . 

有 些 统计 学 家 更 喜欢 把 Y 看 作 是 T+C+S+I1. 尽管 我 们 在 本 章 中 用 (1) 所 提供 的 分 解 
进行 分 析 , 但 和 式 分 解 也 可 得 出 相似 的 结论 .实际 上 ， 全 于 用 哪 一 种 分 解 比较 合适 , 还 得 看 实际 
情况 . 
移动 平均 , 时 间 序 列 的 平稳 化 


考虑 数 集 
Yı, Ү,, Y3, n.e (2) 
上 上 述 序列 相依 的 N 项 的 算术 平均 可 定义 为 N 阶 移动 平均 : 


Y, + Yo 十 … + Yn Ү, + Yz 十 … + YN+1 Y, + Yate + YN42 
Ооу зу ы, а мы... 


序列 (3) 中 的 分 子 称 为 N 阶 移动 和 . 


(3) 


例 1 对 于 数字 2,6,1,5,3,7 和 2 的 3 阶 移动 平均 序列 为 
或 3,4,3,5,4 


Ж, 把 移动 平均 序列 中 的 元 素 和 原始 数据 按 合适 的 对 应 关系 排列 起 来 , 如 此 例 中 为 
原始 数据 2,6,1,5,3,7,2 
3 阶 移动 平均 3,4, 3, 5, 4 

移动 平均 序列 中 的 每 一 元 素 为 其 正 上 方 3 个 元 素 的 均值 . 

按 年 或 月 收集 的 数据 的 N 阶 移动 平均 又 称 为 N -年 移动 平均 , N -月 移动 平均 ,例如 5 – 
年 移动 平均 , 12 -月 移动 平均 等 ,也 可 用 其 他 的 时 间 单 位 . 

移动 平均 有 助 于 减少 数据 集 的 变 差 .在 时 间 序 列 中 ,此 性 质 经 常用 来 减少 不 需要 的 波动 ， 
因此 这 个 过 程 称 为 时 间 序 列 的 平稳 化 . | 

右 在 序列 (3) 中 应 用 加 权 算 术 平 均 , 权重 提前 给 出 , 所 得 到 的 序列 称 为 М 阶 加 权 移 动 平 均 . 

例 2 EER 1 中 增加 权重 1,4,1, 则 3 阶 加 权 移动 平均 序列 为 

1х2+4х6+1х1 1х6+4х1+1х5 1х1+4х5+1х3 1х5+4х3+1х7 


1+4+1 ”’ 1+4+1 2°? 1+4+1 7 1+4+1 
15314х711х2 或 4.5, 2.5, 4.0, 4.0, 5.5. 

趋势 的 估计 
趋势 可 由 下 面 几 种 方法 来 估计 : 


1. 最 小 二 乘法 .此 方法 见 第 十 三 章 , 用 此 方法 可 找到 一 个 与 趋势 线 或 趋势 曲线 相 匹 配 的 
方程 ,运用 方程 即 可 计算 出 趋势 值 Т. 

2. 手 加 法 .此 方法 仅 通过 观察 时 间 序列 图 来 拟 合 一 条 趋势 线 或 趋势 曲线 , 从 而 估计 工 .但 
它 主 要 依赖 主观 判断 , 因此 有 明显 的 不 利之 处 . 

3. 移动 平均 法 .通过 运用 适当 阶 的 移动 平均 , 可 消除 循环 ,季节 , 不 规则 因素 , 只 留 下 趋势 
нж. 

此 方法 的 缺点 :序列 开始 和 末尾 的 数据 丢失 , 在 例 1 中 开始 有 7 个 数据 , 经 过 3 阶 移动 平 
均 之 后 仅 剩 5 个 ;移动 平均 可 能 造成 原始 数据 没有 的 周期 或 其 他 运动 ;移动 平均 还 极 易 受 极端 
值 的 影响 .为 了 克服 这 些 缺 点 , 有 时 用 带 适 当权 重 的 加 权 移 动 平 均 来 蔡 代 , 此 时 中 间 值 的 权重 
大 些 , 而 极端 值 的 权重 小 些 . 

4. 半 平 均 法 .此 方法 把 数据 分 成 两 部 分 (各 部 分 的 元 素 个 数 最 好 相等 ), 对 各 部 分 数据 做 
王 芍 , 则 在 时 间 序 列 图 上 得 到 两 个 点 .从 这 两 个 点 即 可 得 到 趋势 线 , 从 而 直接 计算 趋势 值 Т. 

尽管 此 方法 运用 起 来 简单 ,如 果 不 加 区 别 应 用 , 结果 很 可 能 不 尽 如 人 意 .而 且 ， 仅 当 趋势 线 
是 线性 或 近似 于 线性 时 才 可 应 用 . 它 也 可 推广 到 把 数据 分 为 几 部 分 ， 每 一 部 分 的 趋势 线 呈 线性 
的 情形 . 


季节 变 差 的 估计 , 季节 指数 


为 了 判断 (1) 中 的 季节 因素 S, 必须 估计 在 一 特定 年 度 里 时 间 序 列 的 数据 怎样 从 一 个 月 变 
动 到 男 一 个 月 的 变化 情况 .表示 一 年 各 月 变量 的 相对 值 的 数据 集 就 称 为 变量 的 季节 指数 . 例 
如 , 震 知 道 一 月 ,二 月 ,三 月 , …… 的 销售 额 是 爹 年 月 平均 销售 额 的 50%, 120% ,90%,…, 则 
0%,120%,90%,… 即 可 作为 该 年 的 季节 指数 .一 年 季节 指数 的 均值 应 为 100%, 8р 12 个 月 
的 指数 之 和 为 1200% . 

计算 季节 指数 的 方法 如 下 ， 

1, 日 分 数 平 均 法 .此 方法 中 ,我 们 把 每 月 的 数据 表示 成 年 均值 的 百分数 , 不 同年 但 同一 月 
的 相应 百分数 进行 平均 (用 均值 或 中 位 数 省 可 ); 用 均值 最 好 避免 可 能 的 极端 值 .最 后 得 到 的 
12 个 百分数 即 为 季节 指数 . 若 均值 不 是 100%( 即 和 不 是 1200% ), 应 进行 调整 , 也 就 是 通过 乘 


以 一 适当 因子 得 到 . 

2. 百分数 趋势 法 .此 方法 中 ,把 每 月 的 数据 表示 成 趋势 值 了 的 百分数 ,再 用 上 述 方法 1 得 
到 相应 的 季节 指数 . 若 均 值 不 是 100% , 也 用 1 中 的 方法 进行 调整 . 

注意 从 (1) 中 知 Y/T= CSI, 对 Y/T 再 进行 平均 即 可 得 到 季节 指数 .因为 这 些 指数 包含 
循环 及 不 规则 变 差 ,因此 此 方法 有 一 个 很 大 的 不 利之 处 ,特别 当 这 些 变 差 很 大 时 . 
з. 百分数 移动 平均 法 .此 方法 是 先 计算 12 -月 移动 平均 , 因为 其 值 落 在 相 邻 两 月 之 间 , 所 
以 再 对 其 进行 2 -月 移动 平均 , 这 一 结果 称 为 12 -月 中 心 移动 平均 . 

然后 再 把 每 月 的 原始 数据 表示 成 相对 应 的 12 -月 中 心 移动 平均 的 百分数 , 同一 月 份 的 百 
分 数 再 进行 平均 , 得 到 的 就 是 季节 指数 . 若 其 均值 不 是 100%, 再 进行 相应 调整 ， 

由 (1) 可 看 出 此 法 的 逻辑 推理 .Y 的 12 -月 中 心 移动 平均 是 为 了 消除 季节 因素 S 及 不 规 
则 因素 工 的 影响 , 等 同 于 TC 的 值 ,因此 ,用 原始 数据 Y 除 以 TC 即 可 得 到 51, 随后 对 相应 月 
份 进行 平均 是 为 了 消除 不 规则 因素 Т, 从 而 得 到 季节 指数 S. 


数据 的 六 季节 化 


者 用 原始 数据 除 以 季节 指数 , 所 得 数据 称 为 消 季 节 化 的 或 调整 季节 变 差 的 数据 .这 样 的 数 
据 中 仍 包 含有 趋势 ,循环 和 不 规则 因素 . 


循环 变 差 的 估计 


数据 消去 了 季节 因素 后 ,也 可 进行 趋势 调整 , 只 需 用 相应 趋势 值 T 去 除数 据 即 可 . 由 (1) 
知 ,调整 季节 以 及 趋势 因素 的 方法 是 用 Y 除 以 ST, 从 而 得 到 CI. 用 一 适当 的 移动 平均 (例如 
3,5,7 月 ,采用 奇数 是 为 了 避免 进行 中 心 化 ) 剔 除 不 规则 因素 Г, 只 留 下 周期 因素 C. 一 旦 循环 
变 差 被 分 离 出 来 , 就 可 进行 详细 研究 . 若 时 间 序 列 遵循 一 个 周期 性 或 渐 近 周期 性 的 循环 , 也 可 
像 构 造 季节 指数 一 样 构造 循环 指数 . 


不 规则 变 差 的 估计 


不 规则 变 差 可 通过 调整 趋势 .季节 、 循 环 变 差 得 到 估计 .由 (1) 知 , 可 用 原始 数据 Y 除 以 
T, S,C, 从 而 得 到 了 .实际 上 人 们 发 现 , 不 规则 运动 出 现 的 机 会 较 少 , 且 一 般 服 从 正 态 分 布 


数据 的 可 比 性 


比较 数据 时 必须 始终 小 心 谨慎 ,以 便 使 比较 具有 公正 性 .例如 , 比较 三 月 和 二 月 数据 时 必 
须 注意 到 三 月 有 31 天 ,而 二 月 有 28 或 29 天 ;比较 不 同年 度 二 月 份 数据 时 , 又 要 注意 疼 年 一 月 
有 29 天 而 非 28 天 .另外 ,同一 年 或 不 同年 不 同月 的 工作 日 可 能 会 因为 节假日 . 嗣 工 等 因素 而 
不 同 . 

事实 上 , 这 些 变 差 的 调整 并 无 一 定 的 规律 ,调整 依赖 于 调查 员 的 谨慎 ， 


预测 


А 


以 上 的 方法 可 用 于 时 间 序 列 的 预测 . 必须 看 到 数学 处 理 本 身 并 不 能 解决 所 有 问题 ,但 若 和 
饰 究 者 的 感觉 ,经验 \ 才 智 以 及 判断 力 结合 起 来 ， 数学 分 析 无 论 是 在 长 期 还 是 短期 预测 方面 都 
有 很 大 价值 . 


时 间 序 列 分 析 的 基本 步骤 小 结 


1. 收集 数据 , 确保 数据 的 可 靠 性 , 牢记 时 间 序 列 分 析 的 最 终 目 的 .例如 ,假如 想 预 测 一 给 
定 的 时 间 序 列 ， 获得 相关 的 时 间 序 列 ( 还 有 其 他 信息 ) 将 有 助 于 预测 . 必要 时 , 还 需 对 数据 进行 
调整 ,如 图 年 、 节 假日 等 . 

2. 绘制 时 间 序 列 图 , 定性 标注 季节 ,长 期 趋势 以 及 循环 恋 差 ， 


3. 构造 长 期 趋势 曲线 (或 直线 ), 运用 最 小 二 乘法 , PEA, 移动 平均 法 或 半 移 动 平均 法 求 


得 适当 的 趋势 值 . 


4. 者 季 闻 因素 存在 ,计算 季节 指数 , 并 对 数据 进行 消 季节 化 ( 即 调整 季节 因素 ). 
5. 调整 趋势 因素 , 使 数据 仅 包 含 循环 及 不 规则 因素 ,进行 3,5 或 7 阶 移动 平均 消去 不 规 


则 因素 ,只 留 下 循环 变 差 


绘制 第 5 步 中 得 到 的 循环 变 差 图 , 注意 可 能 存在 周期 或 渐 近 周期 . 


7. 若 想 进行 预测 , ШЕК {ЭР 1—6 的 结论 , 并 运用 其 他 可 能 得 到 的 信息 来 进行 .最 后 对 


各 种 误差 来 源 和 大 小 进行 识别 和 估计 . 


习题 及 解答 


时 间 序 列 的 特征 运动 


18.1 


对 于 如 下 的 几 种 情况 , 你 将 想到 时 间 序 列 的 哪 种 特征 运动 ? 

(а) 工厂 发 生火 灾 , 从 而 使 生产 延误 3 周 ;(b) 经 济 的 繁荣 时 期 ;(c) 某 百 货 商店 复活 节 
后 的 销售 额 ;(d) 由 于 人 口 的 稳定 增长 而 引起 的 小 麦 产量 的 增长 (е) 某 市 5 年 内 的 月 
降雨 量 . 

解 ке 特征 运动 分 别 为 

(а) 不 规则 运动 , (b) 循环 运动 , (c) 季节 运动 , (d) 长 期 运动 , (e) 季节 运动 


移动 平均 ,时间 序列 的 平稳 化 


18.2 


表 18.1 展示 了 1985 一 1995 这 11 年 每 年 美国 的 凶杀 案 总 数 (以 干 计 ). 试 构造 (a) 5 -年 
移动 平均 序列 , (b) 4 -年 移动 平均 序列 . 










1991 1992 1993 1994 


来 源 : 美 国联 邦 调查 局 . 





ЯЕ EF (а) RŽ 18.2, 第 三 列 第 一 个 移动 和 101.9 是 第 二 列 第 1 到 第 5 五 个 元 素 之 和 ;第 三 列 第 


一 个 移动 和 106.3 是 第 二 列 第 2 到 第 6 五 个 元 素 之 和 , 依 此 类 推 .用 5 去 除 每 一 个 移动 和 则 得 到 第 
四 列 的 移动 平均 . 


表 18.2 





(b) 见 表 18.3, 作法 与 (a) 一 样 ,不 同 之 处 是 (a) 中 对 5 个 数据 求 和 及 平均 , 而 (b) 中 对 4 个 数据 求 和 及 
平均 .而 且 其 移动 和 及 移动 平均 位 于 两 相 邻 年 份 的 中 间 . 若 考虑 偶数 阶 移动 平均 时 , 情形 皆 如 此 ， 

目前 移动 平均 一 般 丝 用 统计 软件 来 计算 . 表 18.2 KE 18.3 的 结论 可 用 Minitab 直接 求 得 . 若 利 
ЖН FARE Stat 一 time series 一 moving average 即 可 得 到 任意 阶 的 移动 平均 .4 - 阶 移动 平均 计算 结果 
如 下 : 
MTB >print cl c2 
Data Dispiay 

Row Murders AVERI 


1 19.0 х 
2 20.6 x 
3 20.1 x 
4 20.7 20.100 
5 21.5 20.725 
6 23.4 21.425 
7 24.7 22.575 
8 23.8 23.350 
9 24.5 24.100 
10 23.3 24.075 
11 21.6 23.300 


ЇЁ:АУЕКІ 列 所 展示 的 数值 与 表 18.3 的 第 四 列 完全 - 致 
先 用 手 算法 构造 习题 18.2 的 一 个 4 -年 中 心 移动 平均 , 再 用 Minitab 来 求解 . 
ШО E 方法 I 先 计算 一 个 4 -年 移动 平均 ,如 习题 18.2(b); 这 些 数值 记录 在 相 邻 的 两 年 之 间 ， 


如 表 18.4. 若 再 对 求 出 的 移动 平均 计算 一 个 2 -年 移动 和 ， 结果 就 在 所 需 的 年 份 位置 上 , 用 2 去 除 每 
一 个 结果 , 即 可 得 到 所 需 的 4 -年 中 心 移动 平均 ( 见 第 5 列 ). 


表 18.4 





4 -年 中 心 移动 平均 








年 份 数据 4 -年 移动 平均 第 三 列 的 2 -年 移动 和 (第 四 列 除 以 2) 
1985 

1986 

1987 20.413 
1988 21.075 
1989 22.000 
1990 22.963 
1991 23.725 
1992 24.088 
1993 23.688 
1994 

1995 


AEL ” 先 计算 一 个 4 -年 移动 和 , 如 习题 18.2(b) ,数据 列 在 两 相 邻 年 份 之 间 , 如 表 18.5 所 示 Ж 
对 所 求 得 的 数据 计算 2 -年 移动 和 ， 则 他 们 就 会 出 现在 所 需 的 年 份 位 置 上 ， 对 第 四 列 除 以 8(2x4) 即 
可 得 到 所 需 的 移动 平均 . 


Ж 18.5 


19. 







4 -年 中 心 移动 平均 
(第 四 列 除 以 8) 






20.413 
21.075 
22.000 
22.962 
23.725 
24.087 
23.688 
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Minitab 求解 过 程 如 下 .把 数据 按 列 输入 , 打开 下 拉 菜 单 Stat time series>moving average 即 可 得 
到 中 心 移动 平均 ,下 面 是 输出 结果 . 
MTB> print cl c2 
Data Display: 
Row Murders AVERI 
19.0 x 
20.6 * 
20.1 20.413 
20.7 21.075 
21.5 22.000 
23.4 22.962 
24.7 23.725 
23.8 24.087 
24.5 23.688 
23.3 x 
11 21.6 Ы 
这 与 表 18.4.2 18.5 得 到 的 结论 一 致 . 
18.4 对 习题 18.3, 验证 一 个 4 -年 中 心 移动 平均 与 一 个 5 -年 加 权 移 动 平均 一 致 , 其 中 权重 
分 别 为 1,2,2,2,1. 


解 F 表 18.6 是 5 -年 加 权 移动 平均 表 , 第 三 列 的 第 一 个 数值 为 19.0+2х20.6+2х20.1+2х 


20.7 + 21.5 = 163.3, 第 四 列 的 第 一 个 数值 为 163.3 二 8= 20.4125(0Ч# Жн А X 20.413), 第 三 列 、 第 四 
列 的 其 他 值 计算 方法 与 此 相同 . 注 : 表 18.6 的 5 -年 加 权 移动 平均 与 表 18.4 的 4 -年 中 心 移动 平均 一 


O о лооль U мы н 


= 
© 


Ж. 
. "% 18.6 
1985 19.0 
1986 20.6 
1987 20.1 163.3 20.413 
1988 20.7 168.6 21.075 
1989 21.5 176.0 22.000 
1990 23.4 183,7 22.963 
1991 24.7 189.8 23.725 
1992 23.8 192.7 24.088 
1993 | 24.5 189.5 23.688 
1994 23.3 
1995 21.6 








18.5 ”在 图 上 绘制 出 习题 18.2(a) 的 移动 平均 序列 及 表 18.1 的 原始 数据 序列 . 
解 F 原始 数据 在 图 18-3 上 以 实 线 表 示 , 移动 平均 用 虚线 表示 .注意 移动 平均 图 比 原始 数据 图 光 
滑 了 许多 ,清晰 地 呈现 了 趋势 线 .但 移动 平均 的 一 个 缺点 是 时 间 序 列 的 首尾 数据 技 失 , 当 数 据 量 不 是 
很 大 时 ,后 果 可 能 比较 严重 . 
£ 
t 
Š 
Ж 
ж 
А 
1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 
图 18-3 
趋势 估计 
18.6 用 半 平 均 法 求 习 题 18.2 的 趋势 值 , 分别 采 用 (a) 均值 , (Ь) 中 位 数 . 


М F (а) 把 原始 数据 分 成 两 部 分 (不 考虑 中 间 1990 年 的 值 ), 得 到 表 18.7. 然 后 计算 每 部 分 数据 
的 均值 .均值 20.38 对 应 到 1987 年 , 而 23.58 对 应 到 1993 年 . 


表 18.7 


均值 = 20.38 均值 = 23.58 





过 两 点 (1987,20.38)、(1993,23.58) 的 直线 方程 为 y – 20.38 = 0.5333(z - 1987), 其 中 r 表示 
年 份 , > 表示 相应 年 份 的 凶杀 案 数 .x 从 1985 年 变动 到 1995 年 ， 即 可 通过 方程 得 到 相应 的 y 值 , 从 而 
得 到 趋势 值 , 见 表 18.8. 


表 18.8 
年 份 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 
趋势 值 19.31 19.85 20.38 20.91 21.45 21.98 22.51 23.05 23.58 24.11 24.65 


(b) 1985 年 到 1989 年 数据 的 中 位 数 为 20.6, 1991 年 到 1995 年 数据 的 中 位 数 为 23.8. 过 两 点 (1987， 
20.6)(1993,23.8) 的 直线 方程 为 >- 20.6 =0.5333(х — 1987), 其 中 > 表示 年 份 , y 表示 相应 年 份 


的 凶杀 案 数 .x 从 1985 年 变动 到 1995 ЖЕ, 即 可 通过 方程 得 到 相应 的 y 值 从 而 得 到 趋势 值 , 见 表 
18.9. 


表 18.9 
年 份 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 


趋势 值 19.53 20.07 20.60 21.13 21.67 22.20 22.73 23.27 23.80 24.33 24.87 


若 末 用 中 位 数 进行 计算 ,一 般 称 此 方法 为 半 中 位 数 法 . 


18.7 ЕРА Н (а) РЕ, (b) 移动 平均 法 计算 习题 18.2 的 趋势 值 ? 


E E (а) 用 手 画 法 简单 地 构造 一 条 直线 或 曲线 , 与 图 18-3 很 近似 ,然后 从 此 线 读 取 趋势 值 . 
(b) 从 习题 18.5 可 看 出 ,5 -年 移动 平均 使 时 间 序 列 平滑 了 许多 .因此 可 用 表 18.2 给 出 的 移动 平均 值 
作为 1987 年 到 1993 年 的 趋势 值 . 

(a) 用 Minitab 拟 合 习 题 18.2 的 一 条 直线 ,用 此 最 小 二 乘 直 线 估 计 趋 势 值 . 

(b) 用 Minitab 拟 合 习 题 18.2 的 一 条 抛物 线 ,用 此 最 小 二 乘 曲 线 估计 趋势 值 . 


解 EF (а) 拟 合 习 题 18.2 的 一 条 直线 的 Minitab 输出 如 下 ; 


Regression Analysis 

The regression equation is 

Murder = - 817 + 0.422 Year 

Predictor Coef StDev T P 

Constant ~ 817.3 263.8 —3.10 0.013 

Year 0.4218 0.1326 3.18 0.011 

5=1.390 К - 84= 52.9% R- Ѕа(адј) = 47.7% 

把 1985 年 到 1995 年 的 数据 代入 回归 方程 ,就 可 得 到 趋势 值 ,结果 见 表 18.10. 


Æ 18.10 





(b) 拟 合 习题 18.2 的 一 条 抛物 线 的 Minitab 输出 如 下 : 
Regression Analysis 
The regression equation is 
Murder = — 411596 + 413 Year- 0.104 YearSq 
Predictor Coef StDev T P 
Constahł1596 136581 -3.01 0.017 
Year 413.3 137.3 3.01 0.017 
Year% 10373 0.03449 -3.01 0.017 
5= 1.010 Е- 54=77.9% R- Sa(adj) = 72.4% 
ЇЕ 1985 年 到 1995 年 的 数据 代入 回归 方程 ,就 可 得 到 趋势 值 , 结果 见 表 18.11. 





.0 
‚6 
.1 
-7 
. 5 
.4 
.7 
‚8 
.5 
.3 
.6 


表 18.10 的 残 差 平 方 和 为 17.397, 表 18.11 的 残 差 平方 和 为 8.165. 显然 抛物 线 拟 合 效 果 更 好 ， 
趋势 值 更 接近 实际 情况 . 


季节 变 差 的 估计 ;季节 指数 
18.9 表 18.12 展示 了 从 1990 年 1 月 到 1995 年 12 月 美国 的 月 新 建 住宅 数量 (以 干 计 ). 








表 18.12 
1 月 99.2 52.5 71.6 70.5 76.2 84.5 
2 H 86.9 59.1 78.8 74. 83.5 81.6 
з H 108.5 73.8 111.6 95. .3 103.8 
4 月 119.0 99.7 .6 .6 116.9 
5 Я 121.1 97.7 .2 120. .8 130.5 
6 H 117.8 .4 .8 128. .4 123.4 
7 月 111.2 .5 .2 .8 129.1 
8 月 102.8 .7 .9 .8 135.8 
9 月 93.1 .6 .0 .1 122.4 
10 月 94.2 .8 .8 .6 126.2 
11 月 81.4 .6 .5 .4 107.2 
12 月 57.4 ‚6 .6 .5 92.8 


来 源 : 美 国人 口 调查 局 , 当前 建筑 报告 . 


(a) 构造 一 个 数据 图 . 
(b) 用 百分数 平均 法 计算 季节 指数 . 


Ж ES (a) WE 18-4. 
150 
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图 18-4 ”美国 1990 一 1995 年 的 新 建 住宅 数 


新 建 住宅 


(b) Æ 18.13 表示 1990— 1995 年 各 年 的 新 建 住宅 总 数 以 及 月 均值 . 

用 表 18.13 每 年 的 月 均值 去 除 表 18.12 的 相应 年 份 的 月 数据 , 结果 以 百分数 形式 列 在 表 18.14 
中 .例如 ;1990 年 1 月 对 应 的 值 为 99.2/99.4=99,8%;1991 年 1 月 的 数值 由 52.5/84.5 = 62.1% Ж 
E.R 18.14 的 最 后 一 列 展示 了 每 月 的 平均 百分数 .因为 百分数 之 和 为 1199.8, 所 以 需要 进行 调整 ， 
即 乘 以 因子 1200/1199.8, 使 百分数 之 和 达到 1200. 但 此 调整 对 月 百分数 并 没有 显著 影响 .因此 ,此 列 
的 数值 就 是 我 们 所 需要 的 季节 指数 . 它 表明 , 从 平均 角度 来 看 , 12 月 、1 月 和 2 月 新 建 住宅 最 少 ;而 5 
月 和 6 月 最 多 . 


表 18.13 


1990 1991 1992 1993 1994 
1192.6 1014 .0 1199.6 1287.6 1457.0 
99.4 84.5 100.0 107.3 121.4 
表 18.14 


65. 62. 

68 
110 
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18.10 用 中 位 数 代替 均值 , 计算 习题 18.9 的 季节 指数 . 


解 097 表 18.14 中 1 月 所 在 行 的 数据 以 递增 顺序 排列 为 62.1,62.8,65.7,71.6,74.8 #1 99.8, 其 
中 位 数 为 

(65.7+71.6)/2=68.7 
其 他 月 的 中 位 数 可 用 同样 方法 计算 出 来 , 其 结果 见 表 18.15. 因为 这 些 中 位 数 之 和 为 1197.8, 所 以 可 
通过 因子 1200/1197.8 进行 调整 ,调整 后 数据 见 表 18.15 的 第 三 列 ， 它 就 是 我 们 所 需求 的 季节 指数 ， 
实际 上 , 若 用 均值 与 中 位 数 所 得 到 的 结果 不 同 ,为 了 消除 极 值 的 影响 , 最 好 采用 中 位 数 来 计算 ， 





表 18.15 
月 份 中 位 数 邓 节 指数 
1H 68.7 68.8 
2 月 71.1 71.2 
3 月 100.5 100.7 
4 月 111.6 111.8 
5H 115.6 115.8 
6 А 118.2 118.4 
7 月 109.7 109.9 
8 月 112.8 113.0 
9 月 106.6 106.8 
10 月 111.8 112.0 
11А 91.4 91.6 
12 H 79.9 80.0 


18.11 


用 百分数 趋势 法 计算 习题 18.9 数据 的 季节 指数 . 且 用 最 小 二 乘法 计算 月 趋势 值 . 
# F 从 真实 数据 图 (图 18-4) 可 看 出 ,长 期 趋势 可 近似 用 一 条 直线 来 拟 合 , 我 们 采用 计算 1990 


到 1995 年 的 月 平均 而 非 从 表 18.12 的 数据 得 到 此 直线 , 月 平均 见 表 18,13, 或 表 18.16. 
若 把 从 1990 年 1 月 到 1995 年 12 月 这 72 个 月 用 1 至 72 来 编号 , 则 1990 年 的 月 均值 对 应 于 时 
8] 25 6.5, 1991 年 的 月 均值 对 应 于 时 间 点 18.5, 依次 类 推 ,具体 结论 见 表 18.17. 


表 18.16 





用 Minitab 可 得 到 表 18.17 数据 的 最 小 二 乘 直线 . 


Row Ү X 
1 99.4 6.5 
2 84.5 18.5 
3 100.0 30.5 
4 107.3 42.5 
5 121.4 54.5 
6 112.9 66.5 


MTB > regress ‘Y’ оп 1 predictor ‘X’ 
Regression Analysis 
The regression equation is 
Y=88.1 +0.442 X 
当 X 从 1 变动 到 72 时 ,应 用 上 述 回 归 方程 , 即 可 得 到 从 1990 年 1 月 到 1995 年 12 月 的 所 有 趋 
势 值 ,具体 结果 见 表 18.18. 





用 表 18.12 的 数据 除 以 表 18.18 中 相应 的 趋势 值 ,结果 用 百分数 形式 表示 , 见 表 18 19 因为 第 
八 列 之 和 为 1208.2, 所 以 通过 因子 1200/1208.2 进行 调整 即 可 得 到 第 九 列 的 季节 指数 ; 同 理 , 第 十 
列 中 位 数 之 和 为 1193, 通过 因子 1200/1193 调整 后 的 数据 见 第 十 一 列 . 





18.12 
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用 百分数 移动 平均 法 计算 习题 18.9 的 季节 指数 .用 Minitab 辅助 求解 . 
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E EF 选择 Minitab FARY Stat->Time series—> Moving Average, 并 选择 长 度 为 12 的 中 心 移 动 


平均 ,并 保存 移动 平均 .分析 


吉 果 见 表 18.20. 


表 18.20 


1 月 
2А 
3 月 
4H 
5 月 
6 月 
7 月 
8 月 
9 月 
10 月 
uB 
12А 





116.9 


118. 
119. 
120. 
120. 
121. 


121 


175 
408 
200 
971 
425 


‚763 
122. 
120. 
118. 
116. 
115. 


029 
679 
546 
921 
617 


1995 


115.129 
115.017 
114.529 
114.025 
113.583 
113.088 

* 

ж 
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图 18-5 对 应 于 表 18.20. 注意 ,季节 因素 已 经 消除 , 所 以 使 图 平滑 了 些 . 现 用 12 月 中 心 移动 平 


120 


110 


100 


新 建 住宅 


90 


图 18-5 12 -月 中 心 移动 平均 


均 去 除 相 应 的 原始 月 数据 ,结果 以 百分数 形式 表示 . Minitab 中 ,把 72 个 新 建 住宅 数据 排 在 第 -- 列 ， 
K 18.20 的 12- 月 中 心 移动 平均 排 在 第 二 列 ,选择 命令 Let c3 = cl/c2. 第 三 列 为 表 18.21 中 的 值 . 


1990 1991 1992 
* 61.6 75.9 


表 18.21 


1993 1994 
70.0 65.2 





季节 指数 见 表 18.21, 因为 第 八 列 均值 之 和 为 1191, 需要 通过 因子 1200/1191 进行 调整 结果 
见 表 18.21 的 第 九 列 ; 同 理 , 第 十 列 中 位 数 之 和 为 1185, 通过 因子 1200/1185 修正 结果 见 表 18.21 
的 第 十 一 列 . 
18.13 用 Minitab 计算 习题 18.9 数据 的 季节 指数 . 


M EF 用 Minitab 下 拉 菜 单 Stat 一 Time series 一 Decomposition .选择 模型 类 型 为 Mnultiplicative, 模 
型 成 分 为 Trend plus seasonal, 选择 seasonals 并 保存 .Minitab 输出 如 下 ， 


Time Series Decomposition 


Data Starts 
Length 72.0000 
NMissing 0 


Trend Line Equation 
Yt = 87.7470 + 0.451756 * ү 
Seasonal Indices 
Period Index 
0.708730 
0.718379 
0.943310 

1.15295 
1.17947 
1.20045 
1.08609 
1.11415 
1.08333 
10 1.11307 
11 0.903956 
12 0.796113 


1 
2 
3 
4 
5 
6 
7 
8 
9 


若 用 100 乘 以 指数 值 即 可 得 到 季节 指数 ,70.9, 71.8, 94.3, 115.3, 117.9, 120.0, 108.6, 111.4, 
108.3,111.3,90.4 和 79.6. 

Minitab 采用 如 十 步骤 计算 季节 指数 . 

第 一 步 : 用 最 小 二 乘法 拟 合 一 条 直线 ; 

第 二 步 : 用 趋势 因素 去 除 相应 数据 , 对 数据 消除 趋势 ; 

第 三 步 :用 长 度 等 于 季节 周期 的 中 心 移动 平均 使 消去 趋势 后 的 数据 平滑 , 对 于 月 数据 来 说 长 度 
为 2; 

第 四 步 : 用 移动 平均 数据 去 除 消去 趋势 后 的 数据 , 从 而 得 到 初步 的 季节 指数 ; 

第 五 步 : 在 每 一 个 季节 周期 内 ,计算 初步 季节 指数 的 中 位 数 .调整 中 位 数 ,使 它们 的 均值 为 1. 

下 面 就 给 出 上 述 5 步 用 Minitab 软件 的 具体 实现 过 程 .假定 把 表 18.12 的 月 新 建 住宅 数据 输入 
到 工作 表 的 一 列 , 而 1990 年 1 月 到 1995 年 12 Н 72 个 月 份 以 数字 形式 输入 到 另 一 列 中 , 例如 , 1990 
年 1 月 用 1 来 表示 ,1990 年 2 月 用 2 来 表示 ,依次 类 推 ,直到 1995 年 12 月 用 72 来 表示 .最 佳 的 最 
小 二 乘 拟 合 直 线 的 方程 如 下 . 
МТВ > Regress ‘Starts” 1 ‘time’; 
SUBC> Constant; 
SUBC> Brief 1. 
Regression Analysis 
The regression equation is 


Starts = 87.7 + 0.452 time 


Predictor Coef StDev T P 
Constant 87.747 4.741 18.51 0.000 
time 0.4518 0.1129 4.00 0.000 


$=19.91 R-Sq=18.6% R-Sq(ad)=17.5% 


趋势 值 通过 回归 方程 Starts = 87.7 + 0.452 time 得 到 ,其 中 time 从 1 变动 到 72, 具体 结果 见 表 
18.22. 


Ж 18.22 





用 表 18.22 的 趋势 值 去 除 表 18.12 的 数据 值 以 消去 趋势 ,结论 见 表 18.23. 
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Ж 18.23 的 消去 趋势 的 数据 进行 一 个 12 阶 中 心 移动 平均 ,结果 见 表 18.24. 


表 18.24 


一 
EL 


co 


0.9 

0. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 





用 表 18.24 的 移动 平均 数据 去 除 表 18.23 的 消去 趋势 的 数据 , 得 到 初步 的 季节 指数 , 结论 见 表 
18.25. 


表 18.25 的 最 后 一 列 的 季节 指数 ， 与 下 拉 菜 单 Stat 一 Time Series 一 Decomposition 得 到 的 结论 一 
致 . 


表 18.25 


1992 1993 1994 1995 





调整 后 的 中 位 数 















0.6 0.700 0.709 
0. 0.718 
0. 0.932 0.943 
1. 1.139 1.153 
1. 1.165 1.179 
1. 1.186 1.200 
1. 1.073 1.086 
1. 1.100 1.114 
0. 1.070 1.083 
1. 1.099 1.113 
0. 0.893 0.904 
0. 0.786 0.796 





构造 一 个 表格 , 比较 习题 18.10,18.11,18.12 以 及 18.13 所 计算 的 季节 指数 . 


18.14 
E F 见 表 18.26, 它 展示 了 由 中 位 数 计算 得 到 的 季节 指数 . 
表 18.26 
数据 的 消 季节 化 


18.15 ”调整 习题 18.9 数据 的 季节 变 差 , 即 对 数据 进行 消 季节 化 ,并 展示 如 何 用 Minitab 求 得 


18.16 


消 季节 化 的 数据 . 
解 。 0 要 对 数据 进行 季节 变 差 的 调整 ,就 必须 用 习题 18.9 的 每 个 原始 数据 除 以 相应 的 季节 指 


数 .例如 , 若 采 用 习题 18.13 中 Minitab 计算 出 来 的 季节 指数 , 就 必须 用 70.9%( 即 0.709) 去 除 1 月 
份 的 所 有 数据 .消去 季节 因素 的 数据 见 表 18.27. 


表 18.27 









101.0 
.3 109.7 
.3 118.3 
.5 93.3 101.4 
.9 97.7 110.7 
.2 98.2 102.8 
.3 97.8 118.9 
‚0 98.7 121.9 
.0 97.9 113.0 
.5 100.4 113.4 
.6 93.5 118.6 
.4 98.7 116.6 






应 用 Minitab 下 拉 菜 单 Stat 一 Time serles 一 Decomposition 即 可 得 到 表 18.27 所 示 的 消去 季节 因 
素 的 数据 .使 用 存储 选择 功能 选择 seasonal adjusted data. Æ 18.27 的 数据 将 表示 成 工作 表 的 一 列 . 
(а) 绘制 习题 18.15 的 消去 季节 因素 的 数据 图 ; 
(b) 把 此 图 与 习题 18.9(a) 中 的 图 18-4 进行 比较 . 


解 ES (а) 见 图 18-6. 

(b) 进行 季节 调整 后 的 数据 图 展示 了 一 个 长 期 趋势 , 从 1991 年 开始 相当 接近 于 线性 . 3027 
18.9 的 数据 用 Y= TCSI 表示 , 则 图 18-6 就 是 变量 Y/S = TCI 关于 时 间 的 图 形 , 因此 包含 有 长 期 
趋势 ,循环 以 及 不 规则 运动 . 


140 
130 
120 
Ж 110 
#8 
$ 100 
90 
50 
70 
TT 
1990 1991 1992 1993 1994 1995 
年 份 
图 18-6 消去 季节 因素 的 数据 
循环 及 不 规则 变 差 的 估计 


18.17 对 习题 18.15 的 数据 进行 趋势 修正 . 


E E 为 了 消除 表 18.27 数据 的 趋势 ,用 表 18.27 的 每 一 个 数据 除 以 相应 的 月 趋势 值 (任何 一 
种 方法 计算 出 来 的 皆 可 ). 此 题 中 我 们 采用 表 18.20 给 出 的 月 趋势 值 ,结论 见 表 18.28. 例如, 要 得 到 
1990 年 7 月 的 数据 ,用 表 18.27 的 相应 值 102.4 除 以 97.4( 见 表 18.20) 即 可 ,结果 为 102.4/97.4= 
105.1% .其 他 值 的 计算 方法 一 样 .如 同 涉及 到 移动 平均 的 任何 方法 一 样 , 此 方法 的 缺点 是 时 间 序 列 
首尾 的 数据 丢失 . 





18.18 (а) 绘制 习题 18.17 的 数据 图 . 
(b) 解释 此 图 的 意义 . 
解 ФЕ (а) 从 习题 18.17 的 数据 中 均 减 去 100%, 再 对 偏差 数据 进行 绘制 ,结果 见 图 18-7. 


(b) 原始 数据 用 Y = TCSI 表示 .对 季节 变 差 (见习 题 18.15) 的 调整 相当 于 在 等 式 的 两 边 同 除 以 季 
PER S, BI Y/S = TCI. 接 下 来 对 趋势 的 调整 也 就 是 对 Y/S = ТС 的 两 边 同 除 以 TT, E Y/Y ST = 


此 图 18-7 的 因 变 量 为 
4 ) - 100 = СІ – 100. [Ж 
边 同 减 去 100 个 百分点 , 可 得 (Y/ST , Zz 1. 图 18-7 的 大 
/STI 100 азн уни :图 18-7 маз EARE AT лаз c ы жены 
жым эш 相距 一 年 半 左 右 的 大 变 差 暗示 着 可 能 存在 周期 因素 , 但 要 确证 它 ， 
大 量 地 观测 . 


‚20 


AA ы АА 


百 分 偏 差 
Ф 


图 18-7 ERR HNA 


18.19 (а) 23 118.17 数据 的 3 -月 及 7 -月 移动 平均 . 
(b) 绘制 (a) 中 移动 平均 的 数据 图 . 
(c) 解释 此 图 . M 
н EF (а) 用 Minitab 计算 出 3 -月 及 7 -月 移动 平均 , 减 去 100 个 百分点 后 的 数据 见 表 18 
3 -月 移动 平均 位 于 表 的 上 半 部 分 ,而 7 -月 移动 平均 位 于 下 侧 . 


表 18.29 


Ай |1990 |] 1991 | 1992 | 
ии 1 Я 
2 月 
3 H 
4 月 
5 月 
6 月 
7H 
8 月 
9 月 
10 月 
11 月 
12 月 
1 月 
2 月 
3 月 
4 月 
5 月 
6 月 
7 月 
8 月 
9 月 
10 月 
11 月 
12 月 





* . „ а а . . a * А 二 . - * 
Ы 里 . " 由 ы . 里 А 





(b) 3 -月 及 7- 月 移动 平均 数据 图 见 图 18-8, 18-9. 


-10 


图 18-8 ”3 -月 移动 平均 


百 分 偏 差 


图 18-9 7 -月 移动 平均 


(с) 我 们 希望 移动 平均 能 消除 习题 18.17 数据 的 不 规则 性 ,这 点 可 通过 比较 图 18-8, 18-9 与 图 18-7 
看 出 来 .从 图 中 还 可 看 出 7 -月 移动 平均 比 3 -月 移动 平均 图 更 光滑 些 .3 -月 移动 平均 的 大 部 分 波动 
EF 10% , 而 7 -月 移动 平均 的 波动 低 于 5%. 


数据 的 可 比 性 


18.20 者 考虑 到 1992 FHE, 怎样 修正 习题 18.9 的 数据 ? 


预测 


18.21 


H S 闽 年 的 2 月 有 29 天 而 非 28 天 .为 了 便于 比较 ,用 28/29 Жж 2 月 的 数据 .因此 在 习 


题 18.9 的 表 18.12 中 ,用 (28/29) x 78.8=76.1 来 替换 1992 年 2 月 的 数据 78.8. 在 计算 习题 18.9 


到 18.13 的 季节 指数 时 , 并 未 对 数据 进行 这 样 的 调整 ， 但 它 对 结论 并 没有 多 大 的 影响 , 所 以 可 以 忽 
略 不 计 . 


(а) 用 习题 18.9 中 表 18.12 的 数据 , 预测 美国 1996 年 的 月 新 建 住宅 数 . 

(b) 比较 预测 值 与 真实 值 . 

(с) 给 出 Minitab 预测 . 

Ж EE (3) 时 间 序 列 中 的 预测 值 是 在 已 知 值 的 基础 上 做 出 的 预测 (或 估计 ) .在 进行 预测 时 一般 


仅 用 到 趋势 与 季节 因素 . 即 考虑 Y= TS 而 非 Y = TSCI .循环 及 不 规则 因素 比 趋势 和 季节 因素 要 难 
预测 得 多 . 


假设 可 通过 寻找 与 表 18.12 的 数据 相 拟 合 的 最 小 二 乘 直线 找 出 趋势 成 分 . 在 习题 18 .13 中 此 


直线 的 方程 为 Ѕіагіѕ = 87.747 + 0.452 time, 其 中 时 间 从 1 变动 到 72, 若 让 它 从 73 变动 到 84, 即 可 
得 到 1996 年 的 趋势 值 ,具体 见 表 18.30. 


表 18.30 




















~] 


452 x 73= 120. 


2 H 87.747 +0.452 x 74= 121.2 
3 H 87.747 + 0.452 х 75= 121.6 
4 А 87.747 + 0.452 х 76= 122.1 
5 月 87.747 + 0.452 х 77= 122.5 
6 H 87.747 + 0.452 х 78= 123.0 
7 月 87.747+0.452 х 79= 123.4 
8 月 87.747 + 0.452 x 80 = 123.9 
9 H 87.747 + 0.452 x 81 = 124.3 
10 月 87.747 + 0.452 х 82 = 124.8 
11 А 87.747 + 0.452 х 83 = 125.2 

452 х 84 = 125.7 





Ж 18.26 给 出 的 Minitab 季节 指数 ， 也 可 把 它 与 趋势 因素 相 结合 起 来 进行 预测 , 具体 情况 见 表 
18.31. 


Æ 18.31 


120.7 





预测 值 ( TS ) 
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140. 
144. 
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134. 
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(b) 1996 年 新 建 住宅 的 真实 数据 见 表 18.32. 
表 18.33 展示 了 1996 年 每 月 的 实际 新 建 住宅 数 ,预测 值 以 及 百分数 误差 . 


表 18.32 
116.0 | 146.6 | 143.9 138.0 


















ств 


ИШКИ: 


128.7 | 130.8 111.5 | 93.1 

















1996 年 


е 55 Т 
90.7 95.9 | 116.0 | 146.6 | 143.9 138.0 137.5 | 144.2 | 128.7 130.8 | 111.5 | 93.1 


е oa] аео оя вэ] азаа 


(с) 用 Minitab 下 拉 菜 单 Stats—Time serfles 一 Decomposition ,选择 预测 即 可 得 到 如 下 输出 . 





% 误差 





Time Series Decomposition 


Data Starts 
Length 72.0000 
N Missing 0 


TrendLine Equation 
Yt=87.7470 + 0.451756 * т 


Seasonal Indices 








Period Index 
1 0.708730 
2 0.718379 
3 0.943310 
4 1.15295 
5 1.17947 
6 1.20045 
7 1.08609 
8 1.11415 
9 1.08333 
10 1.11307 
11 0.903956 
12 0.766113 
Forecasts 
Row Period Forecast 
1 73 85.562 
2 74 87.051 
3 75 114.734 
4 76 140.752 
5 77 144.523 
6 78 147.636 
7 79 134.063 
8 80 138.029 
9 81 134.701 
10 82 138.901 
11 83 113.214 
12 84 100.067 
150 。 真实 值 
4 预测 值 
* ЕТИН 
真实 值 折线 
一 一 预测 值 折 线 
a - - - 外 推 预测 值 折线 
#9 100 
Nè 
50 MAPE: 8.626 
MAD: 8.457 
0 10 20 30 40 50 60 70 80 go MSD: 123.230 


时 间 
图 18-10 新建 住宅 的 分 解 拟 合 


注意 , 此 预测 值 与 表 18.33 给 出 的 预测 值 相同 . 
Minitab 也 给 出 了 图 形 18-10, 从 中 可 明显 看 出 预测 值 . 
表 18.12 的 数据 图 用 实 线 表 示 , 预测 值 用 虚线 表示 , 预测 值 的 时 间 从 73 变动 到 84. 


th Ж 2] А] 
时 间 序 列 的 特征 运动 


18.22 ”下列 情形 属于 时 间 序 列 的 哪 种 特征 运动 ? 
(а) 经 济 衰退 , (b) 夏季 就 业 机 会 的 增多 , (с) 因 科 学 的 发 展 而 引起 死亡 率 的 下 降 , (а) 钢铁 工人 圈 
工 ,(e) 小 车 需求 的 持续 增长 . 


移动 平均 


18.23 ”对 数字 1,0, –1,0,1,0, -1,0, 计算 
(а) 2 阶 ,(b) 3 阶 ,(c)4 阶 ,(d) 5 阶 各 阶 移动 平均 . 

18.24 证明 :若菜 一 序列 的 周期 为 N( 即 每 隔 N 项 就 开始 重复 ), 则 任 一 阶 数 小 于 N 的 移动 平均 序列 的 周 
期 此 为 N, 并 用 习题 18.23 来 验证 . 

18.25 (а) 若 在 习题 18.24 中 进行 N 阶 移动 平均 ,将 会 有 什么 情况 发 生 ? 
(b) 者 (a) 中 移动 平均 的 阶 数 大 于 М, 结果 又 如 何 ? 参考 习题 18.23 来 考虑 . 

18.26 证明: 知 序 列 的 每 一 元 素 均 加 上 (或 减 去 ) 一 定常 数 , 则 移动 平均 序列 也 应 增加 (或 减少 ) 同 一 定常 数 ， 

18.27 证 明 :者 序列 的 每 一 元 素 均 乘 以 (或 除 以 ) 一 非 零 定常 数 , 则 移动 平均 序列 也 应 乘 上 (或 除 以 ) 同 一 定 
ЖЖ. 

18.28 计算 习题 18.23 F(b), (с), (d) 的 加 权 移 动 平均 , 其 中 权重 分 别 为 (b) 1,2,1,(c) 1.2 2 和 1, (d) 1, 
2,2,2 和 1. 并 把 它 与 习题 18.23 的 结论 相 比 较 . 

18.29 (а) 在 加 权 移 动 平均 下 ,证 明 习 题 18.26 РЕЖ. 
(b) 习题 18.24 的 结论 对 加 权 移 动 平 均 适 合 吗 ? 

18.30 ”一 序列 有 (a) 24,(b) 25, (с) 200 个 元 素 , 若 对 它们 进行 5 - 阶 移动 平均 ， 则 移动 平均 序列 长 度 各 为 多 
少 ? 

18.31 EFIA M 个 元 素 . 
(а) ERER N - 阶 移动 平均 序列 有 M - N + 1 个 元 素 , 对 不 同 的 М 入， 通过 几 个 例子 来 验证 . 
(b) 当 M= N 时 再 进行 讨论 . 

18.32 X 18.34 展示 了 1986~1995 年 美国 的 离婚 及 无 效 婚姻 数目 (以 干 计 ). 试 构造 


(а) 2 -年 移动 平均 ,(b) 2 -年 中 心 移动 平均 , (с) 3 -年 移动 平均 , (а) 4 -年 中 心 移动 平均 ， (e) 6 -年 移 
动 平均 . 


表 18.34 


1986 | 1987 | 1988 | 1989 | 1990 | 1991 | 1992 
离婚 及 无 效 婚 姻 数 1178 | 1166 | 1167 | 1157 | 1182 | 1189 | 1215 


来 源 ,美国 国家 健康 统计 中 心 . 









1993 1994 
1187 1191 





1169 





18.33 ”绘制 习题 18.32 的 原始 数据 图 及 移动 平均 图 , 并 对 结论 进行 讨论 . 

18.34 (а) 验证 习题 18.32(b) 的 2 -年 中 心 移动 平均 和 3 -年 加 权 移 动 平均 完全 一 致 , 其 中 权重 分 别 为 1, 2， 
1. 表 用 直接 数值 计算 方法 来 验证 ， 
(b) 证 明 习 题 18.32(e) 的 6 -年 中 心 移动 平均 等 于 某 个 适当 权重 的 加 权 移 动 平均 . 

18.35 (а) 对 习题 18.32 的 数据 ,计算 权重 分 别 为 1,4,1 的 3 阶 加 权 移 动 平均 ， 
(b) 绘 制 移动 平均 图 , 并 把 它 与 习题 18.32(c) 的 结果 相 比 较 . 

18.36 18.35 展示 了 1994—1996 年 从 巴西 的 月 进口 值 (单位 ; 百 万 美元 ). 计 算 (a) 12 -月 移动 平均 ，(b) 12 -月 
中 心 移动 平均 ，(c) 6 -月 中 心 移动 平均 .绘制 移动 平均 图 ， 其 上 县 加 原始 数据 图 , 比较 结果 . 


表 18.35 


яв тозаву тве | ю u) 


= ННННННННИ 


来 源 : 美国 调查 局 美国 商品 贸易 . 





趋势 估计 


18.37 
18.38 
18.39 


18.40 


18.41 


用 半 平 均 法 ,计算 习题 18.32 数据 的 趋势 值 ,平均 分 别 采用 (a) 均值 , (b) 中 位 数 .并 绘制 图 形 . 
分 别 用 (a) 手 画 法 , (b) 适当 阶 的 移动 平均 法 求解 习题 18.32, 并 把 它 与 习题 18.37 的 结果 相 比 较 . 
(а) 用 最 小 二 乘法 拟 合 习题 18.32 数据 的 直线 . 

(b) 从 (a) 的 结论 中 找 出 趋势 值 ,并 把 它 与 习题 18.37, 18.38 的 结果 相 比较 . 

(а) ШЖ 18.13 的 月 均值 ,对 习题 18.9 的 数据 拟 合 一 条 抛物 线 了 Y = ao + alX + asX?. 

(b) 把 它 与 习题 18.11 的 最 小 二 乘 直线 相 比 较 , 并 计算 趋势 值 . 

参考 习题 18.36 的 原始 数据 图 ,用 (a) 半 平 均 法 , (b) 手 画 法 , (с) 12 -月 中 心 移 动 平均 , (d) 适当 的 最 
小 二 乘 曲 线 计 算 习 题 18.36 数据 的 趋势 值 , 并 讨论 各 种 方法 的 优 缺 点 


季节 变 差 的 估计 ;季节 指数 


18.42 


18.43 
18.44 
18.45 
18.46 
18.47 


R 18.36 展示 了 1990—1995 年 美国 的 新 建 家 庭 的 月 新 建 住宅 数 (以 千 计 ). 
(a) 绘制 数据 图 . 
(b) 用 百分数 平均 法 计算 季节 指数 , 在 计算 之 前 , 先 对 半年 的 数据 进行 调整 、 


Ж 18.36 





来 源 : 美 国人 口 调查 局 , 当前 建筑 报告 . 


用 百分数 趋势 法 计算 习题 18.42 数据 的 季节 指数 ， 拟 合 一 条 适当 的 最 小 二 乘 曲线 去 计算 趋势 值 
用 百分数 移动 平均 法 计算 习题 18.42 数据 的 季节 指数 ， 

用 类 似 Minitab 的 统计 软件 包 计算 习 题 18.42 数据 的 季节 指数 . 

比较 习题 18.42 至 习题 18.45 的 结论 . 

Ж 18.37 展示 了 1990—1995 年 出 口 到 加 拿 大 的 月 出 口 值 (单位 ; 吾 万 美元 ). 

(a) 绘制 数据 图 . 

(b) 用 百分数 平均 法 计算 季节 指数 . 


18. 
18. 
18. 
18. 
18. 
18. 


18. 


48 
49 
50 
51 
52 
53 


54 


表 18.37 





来 源 : 美 国 调查 局 , 美国 商品 贸易 . 


用 趋势 百分数 法 计算 习题 18.47. 

用 百分数 移动 平均 法 计算 习题 18.47. 

用 类 似 Minitab 的 统计 软件 包 计 算 习 题 18.47 数据 的 季节 指数 . 

比较 习题 18.47 至 习题 18.50 求 得 的 季节 指数 ， 

用 两 种 方法 求 习题 18.36 的 季节 指数 ,并 对 结果 进行 比较 . 

(a) 对 于 习题 18.9 的 数据 , 计算 后 三 年 和 前 三 年 的 季节 指数 ,方法 任意 . 

(b) 对 (a) 的 结果 进行 比较 . 

若 先 对 数据 进行 半年 的 调整 ,重新 计算 习题 18.42 至 18.45 .判断 此 调整 是 否 和 最 后 的 季节 指数 有 显 
著 关 系 ? 


数据 的 消 季 节 化 


18. 


18. 


18. 


55 


56 


57 


(а) 用 习题 18.42 至 18.45 求 得 的 任 一 季节 指数 ,对 习题 18.42 的 数据 进行 消 季节 化 . 
(b) 绘制 消去 季节 因素 的 数据 图 ,并 解释 结论 . 

(а) 调整 习题 18.47 数据 的 季节 变 差 , 可 用 习题 18.47 至 18.51 的 任何 结论 . 

(b) 绘制 消去 季节 因素 的 数据 图 ,并 解释 结论 . 

(а) 用 习题 18.52 求 得 的 两 种 季节 指数 ,对 习题 18.36 的 数据 进行 消 季节 化 . 

(b) 绘制 消去 季节 因素 的 数据 图 , 并 解释 结论 . 


周期 及 不 规则 变 差 的 估计 


18 . 


18 . 


58 


59 


18.60 
18.61 


(а) 用 任 一 种 方法 ,对 习题 18.55 的 数据 进行 趋势 修正 . 

(b) 绘制 所 得 数据 的 图 形 . 

(с) 对 (a) 中 所 得 数据 求 3 ~ 月 及 7 -月 移动 平均 . 

(d) 绘制 (c) 所 得 数据 的 图 形 ,并 对 观测 得 到 的 变 差 进行 解释 , 尤其 要 对 可 能 存在 的 循环 运动 进行 鉴别 . 
若 把 习题 18.55 的 数据 换 成 习题 18.56 的 数据 ,重新 计算 习题 18.58. 

震 把 习题 18.55 的 数据 换 成 习题 18.57 的 数据 , 重新 计算 习题 18.58. 

表 18.38 展示 了 美国 1976 一 1995 每 1000 人 的 结婚 率 . 


表 18.38 





来 源 :美国 国家 健康 统计 中 心 , 美国 生死 统计 . 


18.62 
18.63 


18.64 


预测 


18.65 


18.66 


18.67 


18.68 


(a) 绘制 数据 图 . 

(b) 分 析 数 据 后 , 讨论 数据 的 循环 因素 是 否 明 显 ? 

对 数据 进行 趋势 及 季节 变 差 的 调整 时 ,先后 次 序 不 同 是 否 会 对 结果 有 所 影 啊 ? 

(а) 请 进行 理论 上 的 讨论 , (Ь) 用 习题 18.42,18.47 #ў 18.53 的 时 间 序 列 进行 验证 . 
(a) 用 12 -月 中 心 移动 平均 求解 习题 18.19, 并 绘制 图 形 . 

(b) 从 (a) 中 你 会 得 到 什么 结论 ? 

(a) 对 习题 18.17 及 18.18 得 到 的 不 规则 变 差 , 写 出 其 频数 分 布 . 

(b) 从 (a) 中 得 到 的 频数 分 布 是 否 渐 近 于 正 态 分 布 ? 若 如 此 ,请 给 出 理论 说 明 . 


(a) 用 习题 18.42 的 结论 , 预测 1996 年 新 建 家 庭 的 月 新 建 住宅 数 ( 以 千 计 ). 
(b) 讨论 可 能 的 误差 源 . 
(с) 对 你 的 预测 值 与 真实 数据 ( 见 表 18.39) 进 行 比 较 . 


表 18.39 





(а) 用 习题 18.47 的 结论 , 预测 1996 年 出 日 到 加 拿 大 的 月 出 口 值 ( 单 位 , 百 万 美元 ). 
(b) 讨论 可 能 的 误差 源 . 
(с) 对 你 的 预测 值 与 真实 数据 ( 见 表 18.40) 进 行 比较 . 


表 18.40 





用 习题 18.40 提供 的 最 小 二 乘 抛 物 线 , 预测 习题 18.9 中 1996 的 数据 ,并 把 你 的 预测 值 与 习题 18.21 
的 表 18.32 的 真实 数据 进行 比较 . 

Ж 18.41 展示 了 1993 年 到 1996 年 耐 存 放 与 不 耐 存放 货物 的 月 零售 清单 (单位 . 百 万 美元 ).1995 年 
第 一 季度 的 值 缺失 .用 时 间 序 列 分 析 的 方法 估计 缺失 值 . 若 缺 失 值 为 285, 290, 297, 计算 估计 的 百 分 
误差 . 





表 18.41 
月 份 1996 
1 月 246 297 
2 月 251 301 
3 月 259 303 
4 月 260 305 
5 月 258 304 
6 月 256 300 
7 月 254 300 
8 H 254 303 
9 月 | 263 313 
10 月 279 334 
11 月 286 338 
12 月 263 309 





来 源 :美国 调查 局 ,当前 商业 报告 . 


18.69 “ 若 统 计时 遗漏 了 习题 18.9 的 表 18.12 中 1991 年 3 月 ,4 月 及 5 月 的 新 建 住宅 数 ,试用 时 间 序 列 分 析 


的 方法 进行 估计 . 

18.70 “” 若 统 计时 遗漏 了 习题 18.47 的 表 18.37 中 1994 Æ 10 月 ,11 月 及 12 月 的 数值 ,试用 时 间 序 列 分 析 的 
方法 进行 估计 . 

综合 习题 


18.71 分 析 表 18.42 和 表 18.43 给 出 的 时 间 序 列 . 表 18.42 表示 美国 1976 到 1995 年 每 1000 人 口中 的 出 生 
率 . 表 18.43 表示 1991 年 到 1996 年 汽车 商 的 月 零售 清单 (单位 , 百 万 美元 )， 


表 18.42 





来 源 :美国 国家 健康 统计 中 心 , 美国 生死 统计 . 
















表 18.43 
1 月 | 60.4 65.5 70.3 82.7 88.5 
2 月 .8 68.1 71.7 85.4 89.9 
3 月 .8 ‚3 72.7 88.3 87.9 
4 月 д .9 72.7 89.2 87.2 
5 月 .7 .2 73.8 88.6 87.3 
6 月 .0 .3 73.7 86.5 86.3 
7 月 .6 .2 68.0 79.4 81.3 
8 月 .2 .8 69.1 77.2 80.5 
9 月 .0 .6 71.5 77.9 82.3 
10 月 .4 .3 74.0 83.0 86.4 
11 月 .5 .4 77.8 87.4 88.2 
12 月 .5 .9 80.8 88.6 90.9 





来 源 :美国 调 查 局 , 当前 商业 报告 . 


18.72 X 18.44 展示 了 1991—1996 年 从 美国 出 口 到 墨西哥 的 月 出 口 值 (单位 : 百 万 美元 ). 分 析 此 时 间 序 列 
中 的 季节 和 循环 因素 . 


表 18.44 





来 源 : 美 国 调查 局 , 美国 商品 贸易 . 


第 十 九 章 ”过程 统 计 控 制 和 过 程 性 能 


对 控制 图 的 一 般 讨 论 


任何 过 程 的 变 差 或 是 由 一 般 原 因 引 起 , 或 由 具体 原因 引起 . 存在 于 原材料 、 机 械 和 人 员 上 
的 自然 变 差 通 常 认 为 是 一 般 原 因 引 起 的 变 差 .由 于 过 度 的 工具 损耗 ,新 操作 人 员 , 原材料 性 质 
的 显著 改变 , 更 换 承包 商 等 等 引起 变 差 的 原因 是 具体 原因 , 有 时 也 称 为 指定 原因 .控制 图 的 目 
的 之 一 就 是 找 出 或 尽 可 能 地 消除 变 差 的 指定 原因 .控制 图 一 般 由 控制 限 和 一 条 中 心 线 组 成 ,如 
图 19-1 所 示 . 有 两 个 控制 限 ,分 别称 为 控制 上 限 ( 或 UCL) 和 控制 下 限 ( 或 LCL). 

若 控制 图 上 的 一 点 落 在 控制 限 之 外 , 则 称 此 过 程 超出 控制 . 除 超出 控制 限 的 点 外 ,还 有 其 
他 异常 形式 也 可 表示 过 程 超出 控制 ,后 面 将 会 讨论 这 个 问题 .为 了 预测 过 程 的 行为 ,我 们 还 是 
希望 过 程 处 于 控制 之 中 . 


指定 原因 
UCL 


中 心 线 二 一-- 一 一 一 一 ---————---—-——— — 


LCL 


变量 和 属性 控制 图 


控制 图 可 分 为 变量 控制 图 和 属性 控制 图 .变量 及 属性 是 和 过 程 所 收集 的 数据 的 类 型 相关 
内. 当 测 量 时 间 、 重 量 \ 体 积 、 长 度 、 气 压 、 浓 度 等 数据 时 , 若 其 连续 , 则 认为 它 是 变量 数据 ; 当 考 
虑 茶 产品 的 不 合格 品 数 时 所 得 的 数据 就 认为 是 属性 数据 .一般 认为 变量 数据 比 属性 数据 具有 
优先 级 . 表 19.1 给 出 各 种 变量 和 属性 控制 图 及 其 统计 描绘 . 


表 19.1 
图 表 类 型 统计 图 描绘 
Х-Р 样本 的 平均 值 及 极 差 图 
Х-> 样本 的 平均 值 及 标准 差 图 
中 位 数 图 样本 的 中 位 数 图 
单 值 图 单个 观测 值 绘 图 
累计 和 图 X 减 去 目标 值 的 累计 求 和 图 
带 状 图 带 状 权重 图 
EWMA 图 指数 加 权 移 动 平 均 图 
P -图 不 合格 品 率 , 即 不 合格 品 数 与 总 观测 数 之 比 
NP -图 不 合格 品 总 数 
C -图 样本 容量 不 变 时 , 每 标准 单位 所 包含 的 不 合格 品 数 
U -图 样本 容量 变动 时 , 每 标准 单位 所 包含 的 不 合格 品 数 





表 19.1 中 间 横 线 上 的 部 分 是 变量 控制 图 (或 计量 值 控 制图 ), 下 面 是 属性 控制 图 (或 计数 
值 控制 图 ). 下 面 我 们 仅 讨 论 最 基本 的 图 , НН Minitab 构造 控制 图 .目前 借助 像 Minitab 类 的 
统计 软件 制图 是 很 容易 的 . 
х-к В 
可 通过 考虑 均值 为 и, 标准 差 为 o 的 过 程 来 了 解 广 图 的 思想 .假设 过 程 由 阶段 性 的 数据 
组 成 , 每 个 阶段 称 为 一 个 样本 , 其 容量 为 n, Х 表示 每 个 样本 均值 . 由 中 心 极限 定理 知 , 样本 的 
均值 是 yy, 标准 差 为 os/Vn .样本 均值 的 中 心 线 在 u 处 , 控制 上 限 与 控制 下 限 在 中 心 线 上 或 下 
3(o/Vn ) 处 ,控制 下 限 为 
LCL = p – 3(/ /тп) (1) 
控制 上 限 为 
UCL = и + 3(0/ /а) (2) 
右 过 程 是 正 态 过 程 , 则 样本 均值 将 以 99.7% 的 概率 落 在 上 下 控制 限 之 间 . 实际 上 , 过 程 均值 与 
标准 差 均 未 知 , 需要 估计 出 来 .过 程 均 值 由 阶段 样本 均值 的 均值 来 表示 , 见 (3), 其 中 m 是 容量 
为 n 的 阶段 样本 的 阶段 数 . 
X= 22% (3) 


均值 X 也 可 通过 对 过 程 的 所 有 数据 求 和 , 然后 再 除 以 mn 得 到 .过 程 的 标准 差 的 计算 方法 很 
多 ,例如 合并 样本 方差 ,或 取样 本 标准 差 的 均值 ,或 者 取样 本 极 差 的 均值 , 或 用 历史 值 . 

例 1 表 19.2 是 某 种 产品 宽度 的 数据 .5 个 数据 一 组 ,共有 20 组 . 阶段 样本 组 数 为 m= 
20, 每 个 样本 容量 为 > = 5, 所 有 数据 之 和 为 199.84, 880 X = 1.998. Minitab F tr 2 
Stat 一 Control charts->Xbar 即 可 产生 图 19-2 . 应 用 下 拉 菜 单 之 前 , 先 把 表 19.2 的 数据 排 成 一 
列 输入 进去 . 

此 过 程 的 标准 差 可 由 四 种 方法 估计 .用 20 个 样本 极 差 的 均值 ,或 用 20 个 样本 标准 差 的 均 
值 ,或 合并 样本 方差 ,或 用 已 知 的 历史 数据 .Minitab 支持 这 四 种 方法 . 表 19.2 样本 的 20 个 均 
值 描绘 在 图 19-2 E, 此 图 表示 该 过 程 在 控制 中 ， 各 个 均值 随机 地 在 中 心 线 附近 变动 ,但 没有 一 
个 落 在 控制 限 之 外 . 


表 19.2 


阶段 11 阶段 15 阶段 17 | 阶段 18 阶段 20 


R 图 用 于 对 过 程 的 变动 进行 跟踪 .对 每 一 个 样本 计算 极 差 К, К 图 的 中 心 线 由 (4) 给 出 


R 
К = 228 (4) 
m 
如 同 X 图 , 有 几 种 方法 可 估计 过 程 的 标准 差 . 
2.02 
3.0SI=2.017 
2.01 
ш 20 оз 
长 
t 1.99 
1.98 二 一 一 -一 一 一 | 3 OS LE 1.980 
0 10 20 
样本 序数 


图 19-2 宽度 的 X 图 


例 2 对 表 19.2 的 数据 ,第 一 个 样本 的 极 差 为 R=2.000 一 1.975 =0.025, 第 二 个 样本 
的 极 差 为 R=2.012 – 1.978 = 0.034.20 个 极 差分 别 是 ;0.025, 0.034, 0.038,0.031, 0.028, 
0.030, 0.054, 0.039, 0.026, 0.048, 0.026, 0.018, 0.012, 0.027, 0.030, 0.027, 0.049, 0.053, 
0.047,0.020.20 个 极 差 的 均值 为 0.0331, 极 差 的 Minitab 图 见 图 19-3. 此 R 图 并 未 显示 出 过 
程 的 变化 性 的 任何 异常 行为 . 


0.08 
0.07 





3.0SL=0.06999 
0.06 
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0.04 
0.03 R=0.03310 


样本 极 差 
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0.00 一 ”rr \-3.051—0.000 
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样本 序数 


图 19-3 AEREI 


指定 原因 的 检验 


指定 原因 可 导致 一 点 落 在 控制 限 之 外 ,还 可 造成 过 程 的 非 随机 化 . 表 19.3 罗列 了 8 种 指 
定 原因 的 检验 方法 . 


319.3 指定 原因 的 检验 
1. 某 点 与 中 心 线 的 距离 超过 30. 
2. 连续 9 个 点 位 于 中 心 线 的 同 侧 . 
3. 连续 6 个 点 递增 或 递减 . 
4. 连续 14 个 点 在 中 心 线 上 下 交替 出 现 . 
5. 连续 3 个 点 中 有 2 个 落 在 距离 中 心 线 260 之 外 (注意 3 点 在 中 心 线 同 侧 ). 
6. 连续 5 个 点 中 有 4 个 点 落 在 距离 中 心 线 10 之 外 (注意 5 点 在 中 心 线 同 侧 ). 
7. 连续 15 个 点 落 在 距离 中 心 线 lo 之 内 (两 边 丝 可 ). 
8. 连续 8 个 点 落 在 距离 中 心 线 1c 之 外 (两 边 皆 可 ) 








过 程 性 能 


一 个 过 程 只 有 在 统计 控制 之 下 , 才 可 进行 性 能 分 析 . 通 常 认 为 过 程 是 正 态 的 . 可 用 Kol 
mogorov-Smirnov 检验 ， Ryan-Joiner 检验 ,或 Anderson-Darling 检验 等 方法 来 检验 是 否 是 正 态 
过 程 .过 程 性 能 就 是 对 过 程 行为 与 过 程 要 求 的 比较 .过程 要 求 决定 规格 限 , LSL 和 USL 分 别 表 
示 规 格 下 限 和 规格 上 限 . 

用 来 判断 过 程 是 否 可 控 的 数据 ,也 可 用 来 进行 过 程 性 能 分 析 . 均 值 两 边 30 的 距离 称 为 过 
程 散 差 .为 研究 过 程 统 计 控 制 而 收集 的 数据 , 也 可 用 来 对 过 程 的 均值 与 标准 差 进 行 估计 

з 从 例 2 知 , 表 19.2 的 数据 来 自 一 个 统计 可 控 的 过 程 . 过 程 均值 的 估计 值 为 
1.9984.100 个 观测 值 的 标准 差 为 0.013931. 假定 规格 限 为 LSL = 1.970, USL = 2.030 用 
Minitab 所 提供 的 关于 正 态 性 的 Kolmogorov-Smirnov 检验 , 我 们 并 不 拒绝 过 程 是 正 态 的 .缺陷 
率 计算 如 下 :高 于 USL 的 概率 为 


P(X >2.030) =P X — 1.9984 2.030 – 1.9984 


0.013931 > 0.013931 


=Р(7 > 2.27) = 0.0116 

В USL 线 以 上 有 0.00116 х 1000000 = 11600 ppm( 每 百 万 单位 ) 个 是 有 缺陷 的 . P(Z >2.27) 
可 通过 Minitab 来 计算 ,而 不 用 标准 正 态 分 布 表 .操作 如 下 ， 

MTB> cdf 2.27; 

SUBC > normal 0 1. 

Normal with mean = 0 and standard deviation = 1.00000 

X Р(Х<х) 

2.2700 0.9884 
HJ IL Р(2 < 2.27) = 0.9884, Ж Р(7 > 2.27) = 1 – 0.9884 — 0.0116 . 低 于 LSL 的 概率 
为 P(X < 1.970) = P(Z <-2.04) = 0.0207. 也 可 用 上 述 方法 得 到 ， 

MTB>cdf ~ 2.04; 

SUBC> normal 0 1. 

Normal with mean = 0 and standard deviation = 1.00000 

X P(X€x) 

-2.0400 0.0207 
有 缺陷 单位 的 总 数 为 11600 + 20700 = 32300 ppm. 从 缺陷 单位 来 看 ,这 个 数目 太 大 了 , 让 人 难 
以 接受 . 

以 а 表示 过 程 均 值 的 估计 ,5 表示 过 程 标准 差 的 估计 , 则 缺陷 率 估计 如 下 . 

USL — р 
Р(Х > USL) = pz > 一 


ж 


ол 


LSL — ĝ 
P(X < LSL) = P| Z < 一 一 -一 
б 


过 程 性 能 指数 可 变量 过 程 满足 规格 的 潜能 , 定义 如 下 ， 
容许 散 差 USL ~ LSL 
CP = WERE o (5) 
例 4 表 19.2 数据 中 ， USL – LSL = 2.030 – 1.970 = 0.060, бс = 6 x 0.013931 = 
0.083586, Cp = 0.060/0 .083586 = 0.72. 
Cpx 指 数 可 变量 过 程 行为 ,定义 如 下 ， 


(6) 


Cpk = min 


例 5 对 于 例 1 的 过 程 数据 ， 


2.030 — 1.9984 1.9984 — 1.970) - . 
3 x 0.013931 ° 3 x 0.013931 /= тіп!0.76,0.68| = 0.68 


对 于 仅 有 规格 下 限 的 过 程 而 言 , 下 性 能 指数 Cp 定义 如 下 ， 





USL – f А151) 
36 36 


Срк = пип 





Сы 一 Д (7) 


对 于 仅 有 规格 上 限 的 过 程 而 言 ,上 性 能 指数 Cpj 定 义 如 下 ， 
USL - а 


Ср; 一 Д (8) 
Зс 





因此 Cpk 可 由 Сы Ж Съ Ў: 
Cpk = тіп! Сы , Cpu! (9) 

缺陷 率 和 Cr, Ceu 之 间 具 有 如 下 关系 ， 

LSL – д 





Р(Х < LSL) = P| Z < | = PZ <-3Cp.) 


因为 





LSL – д 
- ЗСы = Д 


с 





USL – д 
P(X > USL) = Р|7 > = P(Z > ЗСы;) 


-a 


б 


因 为 
USL - д 





3CPU = 
С 


016 假定 Сы =1.1, 则 缺陷 率 为 P(Z< -3х1.1)= Р(2< -3.3) 用 Minitab 可 得 到 
计算 结果 . 

MTB> cdf -3.3 put into cl; 

SUBC > normal 0, 1. 

MTB > print cl ; 

SUBC > format (f10.8). 

0. 00048348 


将 有 1000000 x 0. 00048348 = 483 ppm 有 缺陷 的 单位 .用 此 方法 ， 可 构造 性 能 指数 的 缺陷 率 
表 , 见 表 19.4. 


19.4 
CpL X Ср. 缺陷 率 ppm 


.1 0.38208867 382089 
0.27425308 274253 


0.18406010 184060 


.4 0.11506974 115070 


о Фо |Б [ә 
w Кә 





0.7 0.01786436 | 17864 
0.8 0.00819753 | 8198 
0.9 0. 00346702 3467 
1.0 | 0.00134997 1350 
1.1 0.00048348 483 
1.2 0.00015915 159 
1.3 0. 00004812 48 


例 7 用 Minitab 对 表 19.2 的 数据 进行 性 能 分 析 , 可 用 下 拉 菜 单 ;Stat-> Quality tools—> 
Capability Analysis( Normal) 实现 . Minitab 输出 见 图 19-4. 输 出 给 出 了 缺陷 率 ,性 能 指数 , 以 及 
一 些 其 他 的 指标 . 例 3、 例 4、 例 5 的 计算 结果 和 图 中 相应 的 输出 非常 接近 .差异 因 舍 入 误差 以 
及 不 同 的 估计 参数 的 方法 引起 .此 图 用 直方 图 的 形式 表示 样本 分 布 , 过程 的 总 体 分 布 用 正 态 曲 
线 表 示 . USL 右 侧 及 LSL 左 侧 的 尾 面 积 表示 缺陷 百分数 .用 1000000 乘 以 百分数 之 和 , 就 得 到 
过 程 的 ppm 缺陷 率 . 





过 程 数 据 

USL 2.03000 LSL USL ЄТ 
目标 е | ааш в LT 
LSL 1.9700 | 
均值 1.9842 
样本 数 100 | 
标准 差 (Т) 0.0140633 | 
标准 差 (LT 0.0139666 | 

性 能 指数 (ST) | 
Ср 0.71 | 
CPU 0.75 
CPL 0.67 
Cpk 0.67 
Cpm 1.96 1.98 2.00 2.02 2.04 
性 能 指数 (LT) 

缺陷 单位 观察 值 、 

Рр 0.72 PPM<LSL 20000.00 缺陷 单 位 估计 值 〈 ST ) 缺陷 单位 信 计 值 CLT) 
PPU 0.75 PPMSUSI. PPM<LSL 21647.200  PPM<LSL 20933.07 
PPL 0.68 PMA 20000.00  PPM>USL 1236622 PPM>USL 1187648 
Ppk 0.68 40000.00 ррм #1 34013.42 ppPM 和 32809.55 


图 19-4 宽度 的 过 程 性 能 分 析 


-图 和 NP - 


对 批 贡生 产 的 产品 进行 分 类 , 得 到 的 数据 称 为 属性 数据 .产品 必须 满足 的 标准 确定 后 , 规 
格 就 产生 了 .不 满足 此 规格 的 产品 称 有 缺陷 品 . 不 可 用 的 缺陷 品 称 为 不 合格 品 .不 合格 品 比 缺 
陷 品 所 引起 的 后 果 更 严重 ， 基 产 品 可 能 会 因为 褪色 或 摩擦 而 成 为 缺陷 品 , 但 它 并 不 是 不 合格 
品 .检验 失误 可 能 导致 产品 被 划分 到 不 合格 品 以 及 缺陷 品 一 类 .一 单位 产品 上 的 辛 点 称 为 缺陷 
点 ,不 可 修复 的 缺陷 点 称 为 不 合格 点 , 不 合格 点 比 缺 陷 点 所 引起 的 后 果 更 严重 . 

有 四 种 控制 图 可 用 来 处 理 属性 数据 ,分 别 为 :P -图 , NP -图 , C -图 以 及 U -图 . P -图 和 
NP -图 基于 二 项 分 布 ,而 C -图 和 U -图 基于 泊 松 分 布 .P -图 描绘 过 程 的 缺陷 率 , 见 例 8. 

例 8 假设 每 隐 30 分 钟 对 20 个 防毒 面具 进行 检查 ,每 8 小 时 为 一 班组 记录 一 次 不 合格 
品 数 , 每 一 班组 检查 的 总 产品 数 为 =20x16=320. 表 19.5 给 出 30 个 班组 的 记录 结果 .P - 
图 的 中 心 线 等 于 30 个 班组 的 不 合格 品 率 , 即 用 30 个 班组 检查 的 总 产品 数 去 除 总 不 合格 品 数 ， 
或 者 


万 = 72/9600 = 0.0075 
标准 差 可 与 二 项 分 布 联系 起 来 , 即 


(20-Р) _ 


此 过 程 的 3c 控制 限 为 


0.0075 х 0.9925 


320 = 0.004823 


控制 下 限 为 LCL = 0.0075 – 3 x 0.004823 = -0.006969. 当 LCL 为 负 值 时 , 则 认为 其 为 
零 , 因为 不 合格 品 率 不 可 能 小 于 零 .控制 上 限 为 UCL= 0.0075 + 3 х 0.004823 =0.021969. 

P -图 的 Minitab 解 可 通过 下 拉 菜 单 Stat— Control charts—> P 得 到 .此 例 的 P -图 见 图 
19-5. 尽管 样本 15 和 20 表明 可 能 存在 指定 原因 , 但 当 它们 的 不 合格 品 率 两 个 皆 等 于 0.021875 
和 ОСІ. = 0.021969 比较 ,就 可 看 到 这 些 点 并 没有 超出 UCL. 


(10) 








表 19.5 
班 不 合格 品 数 不 合格 品 率 班 合格 品 数 不 合格 品 率 
组 X, Р,= Х/п Х, P,=X/n 
13 0.003125 | 28 ожо 0.000000 
14 0.000000 Еа 2 | o | 0.000000 


3.0SL=0.02197 


Р=0.007500 


不 合格 品 率 





30 


20 
样本 序数 


图 19-5 不 合格 品 数 的 PP -图 


NP -图 描绘 的 是 不 合格 品 数 而 非 不 合格 品 率 .许多 人 认为 NP -图 比 P -图 更 合适 一 点 ， 
因为 对 于 技术 人 员 或 工人 来 说 ,不 合格 品 数 要 比 不 合格 品 率 好 统计 . МР. 图 的 中 心 线 由 nF 给 
定 ,3c 控制 限 为 

np +3 Snap- р) (11) 

ВО Ж%19.5 {ЕН С Ж np =320x0.0075=2.4, 控 制 限 为 LCL=2.4-4.63= 
— 2.23, 因 是 负 值 故 认为 其 为 0, UCL=2.4+4.63=7.03. 如 果菜 班组 生产 出 8 个 或 更 多 不 合 
格 品 , 则 此 过 程 超出 控制 .用 下 拉 菜 单 Stat->Control charts->NP 可 得 到 Minitab @. 

在 执行 下 拉 菜 单 之 前 , 必须 先 把 每 个 样本 的 不 合格 品 数 输入 到 Minitab 工作 表 的 一 列 中 ， 
Minitab 的 NP -图 见 图 19-6. 


8 
7 3.0SL=7.030 
6 
5 
# 4 
ШЕ 
k > МР=2.400 
1 
0 —3.0SL=0.000 
0 10 20 30 


样本 序数 


图 19-6 不 合格 品 数 的 NP -图 


其 他 控制 图 


本 章 仅仅 是 对 控制 图 应 用 的 一 个 简单 介绍 . 表 19.1 列 出 了 目前 工业 生产 装置 应 用 中 的 许 
多 控制 图 .为 了 便于 在 车 间 里 计算 ,有 时 采用 中 位 数 图 ， 印 用 样本 中 位 数 而 非 样本 均值 来 绘图 
假如 样本 容量 为 奇数 ， 则 样本 中 位 数 就 是 样本 值 按 大 小 顺序 排列 后 中 间 位 置 上 的 值 . 

大 产品 数 较 少 ， 则 经 常用 到 单 值 控制 图 . 此 时 样本 仅 包 含 一 个 观测 值 ， 单 值 控 制图 经 常 被 
记 作 X K. 

带 状 图 分 为 四 个 带 , 带 1 表示 距离 均值 1 个 标准 差 以 内 的 范围 , 带 2 表示 距离 均值 1 个 标 


准 差 和 2 个 标准 差 之 间 的 范围 ,人 带 З 表示 距离 均值 2 个 标准 差 和 3 个 标准 差 之 间 的 范围 ,市 4 
表示 距离 均值 3 个 标准 差 以 外 的 范围 .对 于 4 个 带 分 别 指定 权重 .点 落 在 中 心 线 同 侧 的 权重 大 
一 些 . 当 各 点 权重 的 累计 和 大 于 或 等 于 带 4 的 权重 时 , 一 般 就 可 初步 认为 过 程 超出 控制 . 在 初 
步 认 定 过 程 超出 控制 后 ,或 者 当下 一 个 点 穿 过 中 心 线 时 ,累计 和 就 被 重 设 为 0. 

指数 加 权 移 动 平均 图 (EWMA 图 ) 可 以 作为 单 值 图 或 X 图 的 备 选 图 , 它 可 以 用 来 检测 过 
程 平均 值 与 目标 值 之 间 的 微小 变动 .EWMA 图 包含 了 历史 数据 的 全 部 信息 , 不 仅仅 是 当前 数 


据 ( 即 样本 ). 
Х 与 过 程 目标 值 的 偏差 的 累计 求 和 就 是 累计 和 图 . БУМА 图 和 累计 求 和 图 都 可 用 来 检验 
过 程 的 变动 . 


当 我 们 关注 的 是 某 件 产品 中 的 单位 缺陷 点 数 或 单位 不 合格 点 数 而 非 仅仅 考虑 一 件 产品 是 
否 为 合格 品 时 , 就 可 用 C -图 或 U -图 .此 时 有 必要 定义 一 个 观察 单位 ,观察 单位 是 用 来 采样 的 
条 出 的 固定 单位 ,采样 的 目的 是 检查 其 上 的 缺陷 数 . 若 每 个 样本 仅 取 一 个 观察 单位 时 , 我 们 采 
用 C -控制 图 ; 当 每 个 样本 的 观察 单位 个 数 不 定 时 ,采用 U -控制 图 进行 分 析 . 


习题 及 解答 
Х-В Е 


19.1 茶 工 序 是 往 容器 里 装 麦 片 .平均 每 个 容器 装 510 克 , 标准 差 为 5 克 . 每 小 时 选择 4 个 容 
从 ,他 们 的 平均 重量 用 来 对 工序 进行 监控 , 查找 其 指定 原因 , 以 保持 工序 统计 可 控 , 写 
出 X 控制 图 的 控制 上 限 与 控制 下 限 . 
解 к 此 是 中 ,假设 x 和 已 知 ,分 别 为 510 ЯП 5. Ж y 和 未 知 ,可 通过 某 些 方法 进行 估计 . 控 


制 下 限 为 LCL= и —3(о//п)=510-—3х 2.5= 502.5, 控制 上 限 为 UCL= и +3(о// л) = 510 +3 x 
2.5=517.5. 


19.2 19.6 展示 了 20 个 时 间 段 上 某 产品 宽度 的 数据 .又 图 的 控制 限 为 LCL = 1.981, UCL 
=2.081. 试 判断 有 没有 样本 均值 落 在 新 的 控制 限 之 外 ? 


表 19.6 


阶段 1 | 阶段 2 阶段 3 阶段 6 阶段 10 
2.000 | 2.007 | 1.987 1.991 
1.988 | 1.988 | 1.983 1.989 
1.975 2.002 2.006 2.020 2.000 
1.994 1.978 | 2.019 2.016 
1.991 |2012 [2.021 2.037 
阶段 11 | 阶段 12 | 阶段 13 阶段 20 
2.004 | 1.988 | 1.996 1.998 
1.980 1.991 | 2.005 1.969 2.003 
1.998 2.003 1.996 2.018 2.016 
1.994 | 1.997 | 2 008 1.996 
2.006 | 1.985 | 2.007 з [аа |2020 | oo [тою [тов | 2.009 


解 EF 20 个 样本 的 均值 分 别 为 ; 1.9896, 1.9974, 2.0032, 1.9916, 2.0014, 1.9890, 1.9942, 





























1.9952,2.0058, 2.0066, 1.9964, 1.9928, 2.0024, 1.9974, 2.0106, 2.0230, 1.9926, 1.9948, 2.0012 和 
2.0044 .第 十 六 个 均值 ,2.0230 超出 了 控制 上 限 ,其 他 值 都 在 控制 限 之 内 


19.3 见习 题 19.2. 假 定 在 收集 第 十 六 个 样本 时 发 生 了 一 点 意外 ,因此 就 没有 采集 到 第 十 六 
组 数据 , 此 时 重新 计算 控制 限 ,分别 为 LCL =1.979, UCL =2.017. 试 判断 除了 第 十 六 
组 样本 均值 之 外 ,还 有 没有 样本 均值 落 在 新 的 控制 限 之 外 ? 
EO F 除去 第 十 六 组 数据 ,没有 其 他 组 的 均值 落 在 新 的 控制 限 之 外 .假定 新 图 中 没有 出 现 表 19.3 
中 关于 指定 原因 检验 的 任何 情形 , 则 此 题 中 给 定 的 控制 限 可 用 来 对 过 程 进行 监控 . 

19.4 ”验证 习题 19,2 中 给 出 的 控制 限 .通过 合并 20 个 样本 方差 来 估计 过 程 的 标准 差 . 
解 097 100 个 样本 观测 值 的 均值 为 1.999. 找 到 合并 方差 的 方法 之 一 是 用 单 因 素 方差 分 析 的 方法 
去 处 理 20 个 样本 .组 内 均 方 或 误差 均 方 就 是 20 个 样本 的 合并 方差 . Minitab 下 的 方差 分 析 表 如 下 . 


Analysis of Variance 
Source DF SS MS F P 
Factor 19 0.006342 0.000334 1.75 0.044 
Error 80 0.015245 0.000191 
Total 99 0.021587 
标准 差 的 估计 值 为 V0.000191 = 0.01382. 控制 下 限 为 LCL = 1.999 — 3 х (0.01382//5) = 
1.981, 控制 上 限 为 UCL = 1.999 +3 х (0.01382//5) =2.018. 


指定 原因 的 检验 


19.5 %19.7®# 20 个 样本 的 数据 , 每 个 祥 本 容量 为 5. 总 图 见 图 19-7. 知 在 第 十 个 时 间 段 
供应 商 改 变 , 则 对 此 过 程 有 什么 影响 ?在 表 19.3 列 出 的 指定 原因 的 检验 中 , 哪 种 情况 
可 能 发 生 ? 


表 19 .7 


1.994 1.978 2.019 1.990 1.99] 2.016 
1.991 2.021 2.003 1.997 2.037 


解 ES 519.7 的 控制 图 表明 改变 供应 商 引 起 了 宽度 的 增加 .第 十 个 时 间 段 后 的 转变 很 明显 图 
19-7 上 的 数字 6 表明 表 19.3 中 的 第 六 种 情况 发 生 了 , 即 连 续 5 点 中 有 4 点 落 在 距离 中 心 线 10 之 外 
(а 反 在 中 心 线 同 侧 ).5 点 对 应 于 4 到 8 样本 的 数据 . 


过 程 性 能 





























19.6 见习 题 19.2. 夺 已 知 第 十 六 个 样本 引起 了 指定 原因 的 发 生 ， 则 可 删除 此 样本 . 通过 计 
Н 19 个 样本 的 均值 来 佑 计 平均 宽度 ， 页 且 几 他 们 的 样本 标准 差 来 信 计 标准 差 . 
假如 规格 限 为 LSL =1.960 以 及 USI = 2.040, 试 瑟 出 下 性 能 指数 ， 上 性 能 指数 以 及 


X=2.003 


样本 均值 
N 
S 


一 3.0SL=1.985 





一 一 一 一 T 
样本 序数 


图 19-7 宽度 的 多 图 


Cpr 指数， 
E F 除去 第 十 六 个 样本 的 数据 之 后 还 和 镜 下 95 个 观测 值 , 计算 出 f = 1.9982, 6 =0.01400. 则 下 
性 能 指数 为 
A- LSL 1.9982 -1.960 _ 
Cpr = р = 0.0420 = 0.910 
上 性 能 指数 为 
_ USL -g 2.040 -1.9982 _ 
Cru = 3 -00 = 0.995 


且 Срк = тіп! Сы , Ср! = ().91. 


19.7 WJA 19.1. (а) Æ LSL=49$,USL= 525, 试 写 出 缺陷 单位 数 ;(b) Æ LSL = 490, USL 
= 530, 试 写 出 缺陷 单位 数 . 


М F (А) 假设 填充 量 服从 正 态 分 布 , 则 位 于 正 态 曲线 下 LSL 左 侧 的 面积 计算 如 下 : 
MTB> cdf 495 с1; 
SUBC > normal mean = 510 sigma = 5. 
MTB > print cl; 
SUBC> format({10.6). 
0.001350 
由 对 称 性 知 , 位 于 正 态 曲 线 下 USL 右 侧 的 面积 亦 为 0.001350 落 在 规格 限 外 的 总 面积 为 0.002700. 
缺陷 单位 数 ppm 为 0.002700 x 1000000 = 2700. 
(b) 用 同样 的 方法 可 计算 出 LSL = 490, USL = 530 时 的 缺陷 单位 数 ppm. 
MTB >cdf 490 c1; 
SUBC > normal mean= 510 sigma = 5. 
MTB > print с1; 
SUBC > format(f10.6). 
0.000032 
缺陷 单位 数 ppm у 0.000064 x 1000000 = 64. 


P -图 以 及 мр -图 


19.8 ”检查 印刷 电路 板 以 查找 其 中 焊锡 不 合格 者 . 每 天 检查 500 个 印刷 电路 板 , 共 检 查 30 
大 .每 天 的 不 合格 品 数 见 表 19.8. 构 造 P -图 , 查找 指定 原因 


表 19.8 


т ло Т: [з [+ [5 [| [5 [и 
каак э 5 [з |; їз |» |з | [>з 


каша ; 


М F ERRA 
Р +3 


中 心 线 为 р =92/15000 = 0.00613. 标准 差 为 


Р-р) . . 
| _ [0.00613 x 0.99387 _ 00349 
n 500 


控制 下 限 为 0.00613 – 0.01047 = – 0.00434, 因为 百分比 不 可 能 取 负 值 ,所 以 认为 控制 下 限 为 
0, 控制 上 限 为 0.00613 + 0.01047 = 0.0166 .第 十 七 天 的 不 合格 品 率 为 Р; = 10/500=0.02, 它 是 超过 


控制 上 限 的 惟一 的 不 合格 品 率 . 
19.9 SEYA 19.8 数据 的 NP -图 的 控制 限 . 


解 KB 不 合格 品 数 的 控制 限 为 a5 +3 VnB A- 五 ) -PLAX пр = 3.067, 则 控制 下 限 为 0， 


控制 上 限 为 8.034. 


19.10 ”假设 防毒 面具 一 盒 装 25 个 或 50 个 .每 隔 30 分 钟 在 一 班组 内 随机 抽取 一 个 盒子 , 检 
查 其 中 的 不 合格 品 数 . 此 盒 中 有 25 个 或 者 50 个 防毒 面具 . 则 每 班 检查 的 产品 数 从 


400 变动 到 800, 数据 见 表 19.9. 用 Minitab 找 出 不 合格 品 率 的 控制 图 . 


Ж 19.9 


班组 ERFA n, ЛЕЂА Х, 不 合格 品 率 Р, =X,/n, 


0. 
0. 
0. 
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0075 
0122 
0025 


0.0088 
0.0042 
0.0000 
0.0200 
0.0016 
0.0129 
0.0188 
0. 
0 
0 
0 
0 
0 
0 
0 
0 


0175 


‚0075 
‚0096 
‚0063 
‚0050 
‚0088 
‚0189 
‚0113 
‚0120 
0. 


0042 


H F 通过 记录 不 合格 品 数 来 监控 一 个 过 程 时 , 若 样 本 容 基 变动 ,中 心 线 还 保持 不 变 . 即 不 合格 
品 率 是 在 所 有 样本 的 基础 上 求 得 的 .但 是 标准 差 却 随 样本 的 变动 而 变动 ,这 就 提供 了 阶梯 状 的 控制 
限 .控制 限 为 


53 р(1- р) 


中 心 线 为 р =108/11775=0.009172. 对 丁 第 一 个 样本 ,已 知 n, = 400, 


Р\1-р) _ | 2-003172 X 0.990828 = 0.004767 
n, 


以 及 3x 0.004767 = 0.014301. 第 一 个 样本 的 控制 下 限 为 0, 控制 上 限 为 0.009172 + 0.014301 = 
0.023473. 其 他 班组 的 控制 限 也 可 同样 计算 .变动 的 限 值 导致 了 如 图 19-8 阶梯 状 的 控制 上 限 图 . 


3.0SL= 0.02229 
0.02 


35 P=0.009172 


0.00 -3.0SL=0.000 
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图 19-8 不 合格 品 的 P ~ 图 


其 他 控制 图 


19.11 如 宁 测 量 费用 比较 昂贵 , 或 数据 产 出 率 很 低 , 或 在 任何 时 刻 输出 都 很 均匀 时 ,就 可 以 
采用 带 移动 极 差 的 单 值 控 制图 .数据 仅 由 不 同时 刻 收集 的 单个 观测 值 组 成 中 心 线 为 
所 有 单个 观测 值 的 均值 , 变 差 用 移动 极 差 来 估计 . 一 般 情 况 下 ， 移动 极 差 通过 两 个 相 
量 数 据 差 的 绝对 值 来 计算 . 表 19.10 给 出 了 用 于 飞机 的 某 个 较 昂 贵 的 电缆 的 断裂 强 
度 . 数 据 ,它们 是 从 每 天 的 产品 中 选择 一 个 电缆 进行 检验 而 得 到 的 .给 出 由 Minitab 产 
生 的 单 值 图 并 解释 输出 结果 . 


19.12 














5 
2 o e |» I | [ш |» 
515.4 508.0 506.0 510.9 507.6 | 519.1 506.9 510.9 503.9 


Ж E 用 下 拉 菜单 Stat—>Control charts—> Individuals 即 可 得 到 结论 . 


图 19-9 就 是 表 19.10 数据 的 单 值 图 . 表 19.10 的 单个 观测 值 描绘 在 控制 图 上 .控制 图 上 第 九 周 
和 第 十 八 周 的 标注 2 对 应 于 表 19.3 中 的 第 二 个 指定 原因 的 检验 .因为 有 连续 9 个 点 位 于 中 心 线 的 
司 一 侧 , 所 以 可 能 存在 指定 原因 .第 十 个 时 间 点 上 温度 的 增长 导致 了 断裂 强度 的 增加 断裂 强度 的 改 
变 导 致 了 第 十 个 时 间 段 以 前 的 点 都 位 于 中 心 线 之 下 ， 而 第 十 个 时 间 段 后 的 点 大 部 分 位 于 中 心 线 之 上 
指数 加 权 移 动 平 均 图 即 EWMA 图 ， 是 用 来 检测 过 程 平 均值 与 目标 值 ， 之 加 的 微小 变 
动 .EWMA 图 上 的 点 由 如 下 方程 求 出 ， 





19.13 


3.0SL= 520.9 


.| X=505.8 


单个 观测 值 


-3.0SL=490.6 
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图 19-9 强度 的 单 值 图 


z = шх, + (1- wzi 

为 了 展示 此 等 式 的 应 用 , 假设 表 19.7 的 数据 从 目标 值 为 2.000 的 过 程 中 选择 而 来 . 
初始 值 zo 等 于 目标 值 2.000. 权重 w 通常 在 0.10 和 0.30 间 变 动 . Minitab 中 取 w= 
0.20. 则 EWMA 图 上 第 一 个 点 应 为 zi = wri + (1 о) = 0.20 x 1.9896 + 0.80 
x 2.000 = 1.9979 , EWMA 图 上 第 二 个 点 应 为 zy = wz + (1- ш), = 0.20 x 
1.9974 + 0.80 x 1.9979 = 1.9978 .其 他 值 同样 计算 .用 下 拉 菜 单 Stat—Control charts 
>EWMA 可 得 到 Minitab 分 析 , 目标 值 确定 后 , Minitab 输出 见 图 19-10. 参考 图 19- 
10, 分 析 在 哪个 样本 上 ,过 程 偏 离 了 目标 值 ? 


2.010 
3.0SL= 2.006 
2.005 | 
=: 2.000 Х= 2.000 
1.995 
-3.0SL=1.994 
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图 19-10 ”宽度 的 EWMA 图 


解 097 r, 值 的 图 线 在 时 间 点 15 时 穿 过 了 控制 上 限 .因此 我 们 得 到 结论 , 认为 过 程 在 此 点 处 已 
经 偏离 了 目标 值 .注意 EWMA 图 的 控制 限 呈 阶梯 状 . 

带 状 图 分 为 四 个 带 , 带 1 表示 距离 均值 1 个 标准 差 的 范围 , 带 2 表示 距离 均值 1 个 标 
准 差 和 2 个 标准 差 之 间 的 范围 , 带 3 表示 距离 均值 2 个 标准 差 和 3 个 标准 差 之 间 的 
范围 , 带 4 表示 距离 均值 3 个 标准 差 以 外 的 . Minitab 中 指定 各 个 带 的 缺陷 权重 分 别 
为 0,2,4,8( 从 带 1 到 带 4). 扩 落 在 中 心 线 同 侧 的 权重 大 一 些 . 当 累 计 和 大 于 或 等 于 
市 4 的 权重 时 ,一 般 就 可 初步 认为 过 程 超 出 控制 . 在 初步 认定 过 程 超出 控制 后 , 或 者 
当下 个 点 穿 过 中 心 线 时 ,累计 和 就 被 设置 为 0. 图 19.11 展 示 TR 19.6 数据 使 用 带 状 
图 的 Minitab 分 析 . 它 通过 选择 下 拉 菜单 Stat—>Control charts—> Zone 得 到 . 从 此 图 判 


19.14 





Ө, 哪个 点 超出 了 控制 ? 


2.01806 
2.01187 
2.00567 
1.99948 
1.99329 
1.98709 
1.98090 
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图 19-11 宽度 的 带 状 图 


解 к® 第 十 六 组 对 应 的 点 为 超出 控制 点 . 它 对 应 的 累计 和 为 10, 因为 它 超过 带 4 的 权重 值 ,就 可 
以 认为 过 程 的 此 时 间 段 为 超出 控制 时 间 段 . 
当 我 们 关注 的 是 某 件 产品 的 缺陷 点 数 或 不 合格 点 数 而 非 仅仅 考虑 一 件 产品 是 否 为 合 
格 品 时 , 就 可 用 C -图 或 U -图 .此 时 有 必要 定义 一 个 观察 单位 .观察 单位 是 用 来 采样 
的 输出 的 固定 单位 ,采样 的 目的 是 检查 其 上 的 缺陷 点 数 . 若 每 个 样本 仅 取 一 个 观察 单 
位 时 , 我们 采用 C -控制 图 ; 当 每 个 样本 的 观察 单位 个 数 不 定 时 , 采用 U -控制 图 进行 
分 析 . 

С -图 或 U -图 可 以 应 用 在 成 卷 产 品 的 制造 方面 ,例如 纸张 .胶片 .塑料 .纤维 制品 
等 .胶片 上 的 黑 点 ,纤维 制品 上 的 污点 , 针 孔 ， 静电 痕迹 以 及 其 他 成 卷 产 品 上 的 结 块 ， 
都 可 认为 是 缺陷 或 壮 点 , 总 是 在 生产 的 某 个 标准 水 平 发 生 . C -图 或 U -图 就 是 为 了 确 
保 工 序 的 输出 总 是 保持 在 缺陷 发 生 的 可 接受 标准 范围 之 内 .在 整 卷 产 品 中 , 这 些 缺 陷 
的 发 生 一 般 都 是 随机 而 且 相 互 独立 的 .此 时 可 用 泊 松 分 布 形 成 控制 图 . C -图 的 中 心 
线 在 点 = 处 , 即 所 有 样本 缺陷 数 的 均值 . 泊 松 分 布 的 标准 差 为 VE, 因此 Зо 控制 限 为 
с 土 3Vc , 即 控 制 下 限 为 LCL= č- 3VE ,控制 上 限 为 UCL= екз. 

当 往 材料 上 上 涂料 时 ,就 可 能 发 生 称 为 结 块 的 缺陷 . 对 于 某 个 大 捆 产 品 , 假定 观 
测 单 位 为 5 英尺 , 则 其 缺陷 数 记 录 在 表 19.11 中 , 其 中 包含 24 个 样本 . 判断 是 否 有 点 
ТЕ ТЕ Зо 控制 限 之 外 ? 





解 E 每 卷 产 品 结 块 数 的 均值 就 等 于 结 块 总 数 除 以 24, BÈ с = 117/24 = 4.875. 标准 差 为 Vz = 


2.208. 控 制 下 限 为 LCL=4.875-3x2.208= – 1.749. 因为 它 为 负 值 , 故 认 为 控制 下 限 为 0. 控 制 上 
限 为 ОСІ. = 4.875 + 3x2.208=11.499. 第 二 十 个 样本 的 结 块 数 为 13, 超出 了 控制 上 限 11.499, ВП 
第 二 十 个 样本 为 超出 控制 点 . 


19.15 此 问题 追溯 到 习题 19.14. 在 求解 此 问题 之 前 最 好 先 回顾 一 下 习题 19.14 ¥ 19.12 给 


出 了 20 个 特大 卷 产品 的 数据 , 它 提供 了 卷 数 ,每 卷 的 观测 长 度 ， 每 卷 的 观测 单位 数 (在 


习题 19.14 中 ,观测 单位 为 5 ER), 每 卷 观 测 范围 上 的 结 块 数 以 及 每 个 观测 单位 上 的 
结 块 数 . U - РД Аа, 即 通过 第 四 列 之 和 除 以 第 二 列 之 和 得 到 .标准 差 则 随 样 
本 的 改变 而 变化 ,控制 限 呈 阶梯 状 .样本 i 的 控制 下 限 为 LCL = 天 -3 Vai/n,, 控 制 上 
限 为 UCL= +3 /й/п,. 

用 Minitab 构建 此 题 的 控制 图 , 并 判断 工序 是 否 可 控 . 


Ж 19.12 


卷 号 观测 长 度 观测 单位 数 n, 结 块 数 и, = 第 四 列 / 第 三 列 





解 ES U -图 的 中 心 线 为 #, 即 道 过 第 四 列 之 和 除 以 第 三 列 之 和 得 到 .标准 差 则 随 样 本 的 改变 而 
变化 ,控制 限 呈 阶梯 状 . 样 本 i 的 控制 下 限 为 LCL= 吉 -3 Jū/n BERAY ОСІ. = п +3 /й/п,. 
上 述 数据 的 中 心 线 为 = 123/33=3.73. 用 下 拉 菜 单 Stat->Control charts> U 可 得 到 Minitab 解 . 表 
19.12 的 第 三 列 与 第 四 列 数据 提供 了 Minitab 创建 U -控制 图 所 需要 的 信息 . 表 19.12 ЖОЕ U - 控 
制图 见 图 19-12. 从 中 可 看 出 ,并 没有 点 超出 控制 限 . 


3.0SL=7.071 
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图 19-12 ” 结 块 数 的 U -图 


补充 习题 
х-к В 


19.16 10 АЖААН А 319.13 RENEE XMR, ЦЕХ ЖЕ. Х 取 值 的 图 形 , 中 
DRA Х;ВИЕВ—1 Б) R 取 值 的 图 形 , Р R. 


表 19.13 
样本 观测 值 





19.17 某 冷冻 食品 公司 一 袋 包 装 1 磅 (454 克 ) 绿 豆 . 每 隔 2 小 时 ,选择 4 袋 . 重量 近似 到 十 分 位 . 表 19.14 给 
出 了 一 周 的 数据 . 
用 习题 19.4 的 方法 ,通过 合并 20 个 样本 的 方差 估计 标准 差 .用 此 估计 计算 х 图 的 控制 限 . 判断 
有 没有 样本 均值 落 在 控制 限 之 外 ? 
19.18 表 19.14 数据 的 R 图 的 控制 限 为 LCL=0 和 UCL=8.025. 有 没有 样本 极 差 落 在 30 控制 限 外 ? 


表 19.14 





19.19 ”假定 为 了 减少 袋 包 装 的 重量 变动 而 对 习题 19.17 的 工序 进行 调整 .调整 并 使 用 一 段 时 间 之 后 , 得 到 
一 组 新 的 数据 , 见 表 19.15, 新 样本 的 极 差 由 习题 19. 18 所 提供 的 控制 限 来 描绘 . 判断 此 调整 是 否 使 
重量 的 变动 减少 ? 若 如 此 ,用 表 19.15 КОЖЕ X 图 的 新 控制 限 . 


周三 
12:00 





454.6 


454.1 





453.3 
454.3 
周 五 

4:00 

455.4 
452.8 
454.7 


455.1 





指定 原因 的 检验 


19.20 工序 进行 中 工人 频繁 地 调整 工序 会 出 现 问 题 ,显然 比较 麻烦 . 表 19.16 所 包含 的 数据 就 是 反映 了 此 
情形 .计算 X 图 的 控制 限 并 绘制 乏 图 , 最 后 对 表 19.3 的 第 八 种 情形 进行 检查 










表 19.16 
2.006 1.993 1.983 1.985 
1.994 1.983 1.983 
1.981 1.991 1.994 
2.000 1.970 2.010 
1.997 2.001 2.031 
pan [та [паз [инн на | mais | mar pan vas | na 
2.010 1.992 
1.986 1.997 
2.004 2.010 
2.000 1.990 
2.012 2.003 


过 程 性 能 


19.21 假设 习题 19.17 冷冻 食品 包装 的 规格 限 为 LSL= 450 克 和 USL = 458 H. 用 习题 19.17 得 到 的 和 
的 估计 值 来 计算 Cek .同时 估计 不 满足 规格 的 缺陷 单位 数 ppm 
19.22 ”知已 经 进行 了 习题 19.19 的 调整 , 试 计算 习题 19.21 的 Срк, 并 估计 缺陷 单位 数 ppm. 


Р -R NP -E 


19.23 ” 某 公 司 生产 用 于 汽车 电子 系统 的 保险 丝 . 每 天 检查 500 个 保险 丝 , 共 检 查 30 天 . 表 19.17 给 出 了 30 


天 内 每 天 检查 出 的 不 合格 保险 丝 数 . 试 找 出 р -图 的 中 心 线 以 及 控制 上 下 限 ,并 判断 此 工序 是 否 统计 可 
控 ? 若 如 此 , 请 给 出 不 合格 率 的 估计 . 


























—————————_—+——————————- 





19.24 ”假定 在 习题 19.23 中 ,保险 丝 生产 厂商 想 用 NP -图 来 代替 P -图 . 试 找 出 NP -图 的 中 心 线 以 及 控制 
КЕШ. 

19.25 AKAA PESE AA H Е Scottie Long 对 有 轻微 褪色 的 牛肉 包装 袋 的 百分数 特别 感 兴 
趣 .每 天 检测 的 袋 数 不 定 , 记录 下 有 轻微 褪色 的 袋 数 .数据 见 表 19.18. 试 给 出 20 个 样本 的 阶梯 状 的 








控制 上 限 . 
表 19.18 
1 1 
2 1 
3 0 
4 1 
5 1 
6 0 
7 0 
8 0 
9 0 
10 2 
11 1 
1 
3 
2 
1 
1 
4 
0 
0 
2 
其 他 控制 图 


19.26 求解 此 问题 之 前 先 回顾 一 下 习题 19,11.24 小 时 内 每 隔 一 小 时 就 检查 一 下 烤箱 ( 烤 面包 ) 的 温度 . 烘 
烤 温 度 对 工序 来 说 是 非常 关键 的 .数据 见 表 19.19. 借助 单 值 图 来 监控 工序 的 温度 . 试 写 出 中 心 线 以 
及 移动 极 差 ( 相 临 两 数据 差 的 绝对 值 ), 并 考虑 如 何 计算 控制 限 ? 





19.27 求解 此 问题 之 前 先 回顾 一 下 习题 19.12 用 Minitab 建立 表 19.14 数据 的 ЕММА 图 . 若 目 标 值 取 为 
454 殉 , 从 图 中 你 能 得 到 什么 结论 ， 


19.28 ”求解 此 问题 之 前 先 回顾 一 下 习题 19.13 的 带 状 图 .建立 表 19.16 数据 的 带 状 图 . 从 中 能 否 看 出 有 超 
出 控制 的 情形 ”从 此 习题 中 , 你 看 出 了 带 状 图 的 什么 缺点 ? 

19.29 ”求解 此 问题 之 前 先 回顾 一 下 习题 19.15. 建立 习题 19.15 中 U -图 的 阶梯 状 的 控制 限 . 

19.30 Pareo 图 经 常用 于 质量 控制 中 . 它 是 一 个 条 形 图 , 罗列 了 以 递减 次 序 观察 到 的 缺陷 .最 常 发 生 的 缺陷 
列 在 第 一 位 ,频率 稍 小 一 点 的 列 在 第 二 位 , 依次 类 推 .用 这 样 的 图 表 可 找 出 我 们 所 关注 的 面积 , 并 可 
以 党 试 去 消除 或 减少 缺陷 百分数 最 大 的 缺陷 .下 面 是 在 给 定时 间 段 内 ,检查 防毒 面具 时 所 发 现 的 缺 
KRE Р AR MARET. RLR 19.20. 





表 19.20 
褪色 褪色 银色 
带 松 带 松 带 松 
褪色 A 98 带 松 
ЖЕ, 带 松 Ж 
银色 AR 撕 裂 
21 #2. 银色 


图 19-13 是 Minitab 生成 的 Pareto 图 . 表 19.20 的 数据 输入 到 工作 表 的 一 列 中 .用 下 拉 菜 单 Stat 
一 Quality tools->Pareto charts 即 可 得 到 此 图 . 从 此 图 判断 ， 哪 种 缺陷 最 值得 关注 , 其 次 是 哪 一 种 ? 






30 100 
80 
20 
60 
Ж A 
< 10 分 
Ж 
20 
0 0 
缺陷 E 带 松 撕 裂 ШЙ #Я, 
个 数 14 6 4 4 2 
百分数 46.7 20.0 13.3 13.3 6.7 
累积 百分数 467 66.7 80.0 93.3 100.0 


图 19-13 ”防毒 面具 缺陷 图 
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‚55 


‚56 


‚57 
‚58 


‚76 


.77 


.78 
.79 


.80 


‚81 


‚82 


‚83 


„84 


‚85 


‚86 


‚88 


(а) 连续 ;(b) 连续 ;(c) 离散 ;(d) 离散 ;(e) 离散 . 

(а) ХРО; 24. (b) 2,3.…; 离 散 . (с) 单身 ,已 媚 , 离 异 , 分 居 , 鲁 居 ; 敲 散 . (d) 大 于 0; 连续 .(e) 0, 
1,2,… ;离散 . 

(а) 3300;(b) 5.8;(c) 0.004;(4) 46.74; (е) 126.00;(#) 4 000 000; (р) 148;(h) 0.000099; (i) 2180; 
(j) 43.88. 

(а) 1 325 000;(b) 0.0041872; (с) 0.0000280;(d) 7 300 000 000; (е) 0.0003487; (f) 18.50. 

(а) 3; (Ь) 4; (с) 7; (4) 3; (е) 8; (1) 无 极限 ;(g) 3;(h) 3; (1) 4; (0) 5. 

(а) 0.005 百 万 蒲式耳 ,或 5000 HAH ;3. (b) 0.000000005 ЕЖ, я 5х107°ШЖ;4. (с) 0.5 ЖМ; 
4. (d) 0.05 х 10° Ж 5 х 10° Ж;2. (е) 0.5 英 里 / 秒 ;6. (0 0.5 千 英里 / 秒 或 500 英里 / 秒 ;3. 

(а) 3.17х 10; (Ь)4.280 х 10°; (с) 2.160000 х 10“; (4) 9.810 х 10°; (е) 7.32 х 10°; (£) 1.80 х 
107°, 

(а) 374; (Ь) 14.0. 

(а) 280( 两 个 有 效 数字 ),2.8 AE 2.8 х 102; (Ь)178.9; (с) 250 000( 三 个 有 效 数 字 ), 250 FÈ 2.50 х 
10%; (d)53.0; (е)5.461; (£)9.05;(g)11.54; (h) 5 745 000( 四 个 有 效 数 字 ), 5745 F, 5.745 百 万 或 
5.745 х 10; (1)1.2;(;)4157. 


(а) – 11;(Ь) 2; (с) SR 4.375; (d) 21; (е) 3;(f) ~16;(g) V98 或 约 等 于 9.89961; (h) -7/ V34 或 


约 等 于 – 1.20049; (1) 32;(;) 10/ V17 或 约 等 于 2.42536. 
(а) 22, 18, 14, 10, 6,2, – 2, -6 和 -10;(b) 19.6,16.4,13.2,2.8, -0.8, -4 和 -8.4;(c) –1.2,30, 


10-4V2=4.34 #1 10 + 4лх522.57;(4) 3,1,5,2.1, -1.5,2.5 和 0;(e) Х =--(10- Y). 

(а)—5;(Ъ) —24;(с) 8. 

(a)—8;(b) 4;(c) — 16. 

(а) -4;(b) 2i(e) 5;(d) 4:06) 1;(f) -7. 

(а) a=3,b=4;(b) а= -2,8=6i(c) X= -0.2, Y= -1.2;(d) А = f ~ 26.28571, В = 0 
15.71429; (е) a=2,6=3,c=5;(f) X= -1,Ү=3,2= -2;(g) U=0.4, V= -0.8 W =0.3. 
(b)(2, -3), B] X=2, Y= —3. 

(а) 2, -2.5;(b) 2.1 和 -0,8( 约 等 于 ). 


刻 
(а) =. 他 或 约 等 于 2.12 和 -0.19;(b) 2 和 -2.5;(e) 约 等 于 0.549 12.549; 


-в+/536 -8+/36х/ 51 -8+6 
(а) 2—38 —8= /36х VI Е: si 4+3i, 其 中 i= VTL. 


这 些 根 为 复数 , 当 绘 制图 形 时 ,将 不 会 出 现 . 

(а) ~ 6.15< -4.3< -1.5<1.52<2.37; 

(b) 2.37>1.52> -1.5> -4.3> -6.15. 

(a) 30< N50;(b) SÈ7;(c) - 4<Х<3;(4) Р<5;(е) Х-Ү>2. 

(а) Х24;(Ь) Х>3;(с) М<5;(4) Ү<1;(е) -8%<Х<7( -1.8<N<3;(g) 2<а<22. 

(а) 2.5877; (b) 9.5877 – 10; (с) 8.8987 — 10; (d) 4.1653; (е) 9.7812 - 10; (f) 7.4464 – 10; 
(g) 2.6779; (h) 0.0030; (1) 0.8541; (j) 1.8541; (k) 6.9912- 10; (1) 7.9275. 

(а) 3640; (b) 0.675; (с) 50.64; (d) 0.08445; (e) 295.1; (£) 0.0002951; (g) 0.06314; (h) 5096; 
(1) 1202; (3) 2422000 2 2.422 x 105. 

(а) 1296000 2% 1.296 х 10%; (Ь) 0.05739 3È 0.0574 三 个 有 效 数 字 ;(c) 556.0;(4) 804.4; (е) 40820; 
(£) 0.03438; (в) 15.51; (h) 45.67; (i) 0.0004519 = 4.519 х 1075] 4.52 х 10 一 三 个 有 效 数字 ; 
(j)3096. 

(a) Х?= 100Ү?;(Ь) Ү=3х107 2%, 





1.89 (а) 3;(b) (с) —24(4) —5;(е) 0. 


第 二 章 
2.19 (Ь) 62. 
2.20 (а) 799; (Ь) 1000; (с) 949.5; (d) 1099.5 和 1199.5; (е) 100 CEt); (£) 76; (в) 82 = 0.155 或 


15.5% ; (h) 29.5%; (1) 19.0% ; (j) 78.0%. 


2.25 (a)24%;(b)11%;(c) 46%. 
2.26 (а) 0.003 英寸 ;(b) 0.3195,0.3225,0.3255, … ,0.3375 英寸 ; 
(с) 0.320— 0.322, 0.323 —0.325,0.326— 0.328, -··,0.335 0.337 英寸 . 
2.31 (а) 每 个 5 年 ;(b) 4( 尽 管 严格 说 来 最 后 一 组 大 小 不 明确 );(c) 1; (d) (85—94); (е) 7 年 和 17 年; 
(£) 14.5 年 和 19.5 年 ;(g) 49.3% 和 87.3% ; (h) 45.1%; OREK E. 
2.33 19.3,19.3,19.1,18.6,17.5,19.1,21.5,22.5,20.7,18.3,14.0,11.4,10.1,18.6,11.4 和 3.7( 因 为 存 
在 百分数 会 入 误差 , 他们 的 和 不 会 超过 265 百 万 ). 
2.34 (Ы) 0.295; (с) 0.19;(4) 0. 
第 三 章 
3.47 (а)Х,+Х,+Х,+Х,+8; 
(b) fiX? + fX} РХ р ХА 方 X2; 
(с) Ui(U1+6)+ 0,00 +6) + U,(U3 +6); 
(d) Y} + Y+- + Y% -4N; 
(е)4Х,Ү,+4Х,Ү,+4Х,Ү,+4Х,Ү,. 
3 15 М 
3.48 (а) >,(Х, + 3)° ;(Ь) DEY; -a)l УХ, - 3Y;) ; 
1=1 了 一 
8 ix 2 >а) 
(4) EE (е) ЧЫ—. 
у=1 2 24% 
3.51 (а) 20;(b) -37;(c) 53;(d) 6;(е) 226;(ї) ~ 62; (g) 23. 
3.52 (а) – 1;(Ъ) 23. 
3.53 86. 
3.54 0.50%. 
3.55 8.25. 
3.56 (а) 82; (Ь) 79. 
3.57 78. 
3.58 66.7% 男性 和 33.3% СЕ. 
3.59 11.09 8. 
3.60 501.0. 
3.61 0.72642 厘米 . 
3.62 26.2. 
3.63 715 分 钟 . 
3.64 (b) 1.7349 ШЖ. 
3.65 (a) 均值 =5.4, 中 位 数 =5;(b) 均值 = 19.91, 中 位 数 =19.85. 
3.66 85. 
3.67 0.51 秒 . 
3.68 8. 
3.69 11.07 吨 . 
3.70 490.6. 
3.71 0.72638 厘米 . 


.72 25.4. 
-73 ” 约 等 于 78.3 年 . 
.74 35.7 年 . 
.75 708.3 分 钟 . 
.76 (а) 均值 =8.9, 中 位 数 =9, 众 数 =7. 
(b) 均值 =6.4, 中 位 数 =6. 因 为 数字 4,5,6,8 和 10 均 出 现 两 次 ,因此 我 们 认为 他 们 均 为 众 数 ,不 过 此 
时 认为 众 数 不 存在 更 合理 . 
.77 “不 存在 . 
.78 0.53 秒 . 
.79 10. 
.80 11.06 MẸ. 
.81 462. 
.82 0.72632 厘米 . 
.83 23.5. 
.84 668.7 分 钟 . 
85 (а) 35—39;(Ь) 75—84. 
86 (а) 利用 公式 (9), 众 数 =11.1; 利 用 公式 (10), 众 数 =11.03. 
(b) 利用 公式 (9), 众 数 =0.7264; 利 用 公式 (10), 众 数 = 0.7263. 
(с) 利用 公式 (9), ХХ = 23.5; 利 用 公式 (10), 众 数 =23.8. 
(а) 利用 公式 (9), 众 数 =668.7; 利 用 公式 (10), 众 数 = 694.9. 


Ww ш ш ышы ы 


w ошо ш ш шш ш ә Ыш U ы 


.88 (а) 8.4;(b) 4.23. 

.89 (а) G=8;(b) Х=12.4. 

„90 (а) 4.14;(Ъ) 45.8. 

.9t (а) 11.07 0; (Ь) 499.5. 

.92 18.9%. 

.93 (а) 1.01%; (Ь) 238.2 А2; (с) 276.995. 
94 $1586.87. 

95 $1608.44. 


96 3.691 14.4. 

97 (а) 3.0; (Ь) 4.48. 

98 (а) 3; (Ь) 0; (с) 0. 

100 (а) 11.04; (Ь) 498.2. 

.101 38.3 英里 /小 时 . 

.102 (b) 420 英里 /小 时 . 

104 (а) 25;(b) 3.55. 

107 (а) 第 一 四 分 位 数 = Qi =67, 第 二 四 分 位 数 = Q, = 中 位 数 = 75, 第 三 四 分 位 数 = О; = 83. 
(b) 分 数 不 超 过 67 的 占 25%, 分 数 不 超 过 75 的 占 50%, 分 数 不 超 过 83 的 占 75%. 


wW © ш ш ш ә ш ә ш шыш ш ш ш ә ә» шө 


3.108 (а) Qi=10.55 吨 ,Qz=11.07 吨 ,Qi=11.57 ME; (b) Qi= 469.3, 0=490.6, Q; = 523.3. 
3.109 算术 平均 ， 中 位 数 ， 众 数 ， Q3, P sof Ds. 

3.110 (а) 10.15 ;(Ь) 11.78 吨 ;(c) 10.55 mE; (d) 11.57 mt., 

3.112 (а) 83;(b) 64. 

第 四 音 

4.33 (а) 9;(b) 4.273. 

4.34 4.0m. 


4.35 0.0036 ЖЖ. 

4.36 7.88 公斤 . 

4.37 20%. 

4.38 (а) 18.2;(b) 3.58;(c) 6.21; (4) 0; (е) /2œ1.414;({) 1.88. 


.39 (a)2;(b) 0.85. 

40 (а) 2.2;(b) 1.317. 

41 0.576 8. 

.42 (а) 0.00437 ЯЖ; (Ь) 60.0%,85.2%#1 96.4%. 
43 (а) 3.0;(Ь) 2.8. 

.44 (а) 31.2; (Ь) 30.6. 

.45 (а) 6.0; (Ь) 6.0. 

.46 4.210. 

48 (а) 0.51 01; (Ь) 27.0; (с) 12. 

49 3.5 Й. 

52 (а) 1.63 吨 ;(b) 33.6 #Ё 34. 

53 10—90 百 分 位 极 差 为 $189500, 销售 价 的 80% 落 在 $ 1302505 $ 94750 内 . 
.56 (а) 2.16;(b) 0.90; (с) 0.484. 

.S8 45. 

.59 (а) 0.733 吨 ;(b) 38.60;(с) 12.1. 

.61 (а) X=2.47;(b) s=1.11. 

.62 s=5.2 和 极 差 /4=5. 

.63 (а) 0.00576 厘米 ;(b) 72.1%,93.3%,99.76%. 
.64 (а) 0.719 吨 ;(b) 38.24;(c) 11.8. 

.65 (а) 0.000569 厘米 ;(b) 71.6%,93.0%, 99.68%. 
66 (а) 146.8 磅 和 12.9 в. 

-67 (а) 1.7349 厘米 和 0.00495 厘米 . 

.74 (а) 15;(Ь) 12. 

.75 (а) 统计 学 ;(b) 代数 . 

.76 (а)6.6%;(Ь) 19.0%. 


> > Р > > > > > > > > > > > рь ь рь рь ь ЬЬ ЬЬ 


.77 0.15. 
.78 0.20. 
79 КЖ. 
.80 0.19,-1.75,1.17,0.68, – 0.29. 
第 五 章 
5.15 (а) 6;(b) 40;(c) 288;(d) 2188. 
5.16 (а) 0;(b) 4;(c) 0;(d) 25.86. 
5.17 (а) -1;(b) 5;(<) —91;(4) 53. 
5.19 0,26.25,0,1193.1. 
5.21 7. 
5.22 (а) 0,6, 19, 42;(Ь) - 4,22, — 117, 560; (с) 1,7, 38, 155. 
5.23 0, 0.2344, —– 0.0586, 0.0696. 
5.25 (а) т; =0;(Ь) тз = ро; (с) тз = pq(g = р); (d) та= pq(p’ ~ ро + 92). 
5.27 т, =0, тә=5.97, тз = – 0.397, m, = 89.22. 
5.29 т, (Ё 1Е) =0, m2( 修 正 ) = 5.440, ms( 修 正 ) = — 0.5920, m4( 修 正 ) = 76.2332. 
5.30 (а) т; =0, т, = 0.53743, т; = 0.36206, та = 0.84914; 


(b) m (ZIE) = 0.51660, ms( 修 正 ) =0.78378. 


5.31 (а) 0;(Ъ) 52.95; (с) 92.35; (4) 7158.20; (е) 26.2; (f) 7.28; (g) 739.58; (h) 22247; (i) 706428; 
(3) 24545. 

5.32 (а) – 0.2464; (Ь) – 0.2464. 

5.33 0.9190. 

5.34 第 一 分 布 . 

5.35 (а) 0.040;(Ъ) 0.074. 


5.36 (а) —0.02;(Ъ) —0.13. 
5.37 
Pearson Ж < 
5.38 (а) 2.62;(Ь) 2.58. 
5.39 (а) 2.94; (Ь) 2.94. 
5.40 (а) 第 二 ;(b) 第 一 . 
5.41 (а) 第 二 ;(b) ЖЖ; (с) 第 一 . 
5.42 (а) 大 于 1875;(b) 等 于 1875;(c) 小 于 1875. 
5.43 (а) 0.313. 
第 六 章 
5 5. „(ау 和 .了 
6.40 (a) 26:00) 3g? (0) 0.98; (4) 9 ;(e) 8 
6.41 (а) 第 一 次 抽 到 牌 K 而 第 二 次 未 抽 到 牌 K 的 概率 ; 
(b) 第 一 次 和 第 二 次 至 少 有 一 次 抽 到 牌 K 的 概率 ; 
(с) 第 一 次 和 第 二 次 至 少 有 一 次 未 抽 到 牌 K 的 概率 ; 
(d) 在 第 一 次 抽 到 牌 K 而 第 二 次 未 抽 到 K 的 条 件 下 , 第 三 次 抽 到 牌 К 的 概率 ， 
(е) 第 一 , Ж, 第 三 次 均 未 抽 到 牌 К 的 概率 ; 
(f) 第 一 次 和 第 二 次 均 抽 到 牌 К 或 第 二 次 未 抽 到 牌 K 而 第 三 次 抽 到 牌 K 的 概率 . 
1. 3. п. 2 (у 4. 
6.42 (а) 3 ;(b) 5 ;(c) 1554) 5 ; (е) 5 ` 
4 оь) Eo Ea 64 0 1 1104 ,2 ,6 ,52 
29 (b 2,00) 18.04) 52,11, IT 86 ，182 ,9 , 26 
6.44 (a) 185105) 355 (c) 185354) 1855) 15:00) z ; (g) igs (h) 18551) 37500) 117 
3. lt al 
6.45 (a) 15:0) 3g? (C) 36 
47 бъ) 16 („у 15 (ду 13,210 10,40, 77 
6.46 (а) 52:6) 291+ (9) 34:49) 17:68) 22100) 13:<8) 51508) 442: 
5 
6.47 18` 
6.48 (а) 81:44;(Ъ) 21:4. 
19 
6.49 42` | 
和 之, 1/ 4. ,13 
6.51 (а) 37.5% ;(b) 93.75% ; (c) 6.25% ; (d) 68.75%. 
6.52 (a) 
6.53 (а) zgb) Filo 2,04) 2. 
6.54 (а) 











6.55 (а) у. ЕЖЕН) 2 个 红 球 的 概率 ， 


(b) 记 . 它 表示 至 少 抽 到 一 个 红 球 的 概率 ， 
.56 $9. 
.57 每 天 $4.80. 
.58 А 拿 出 $12.50;B 拿 出 $7.50. 
.59 (а) 7;(Ь) 590;(с) 541;(d) 10900. 
.60 (а) 1.2;(b) 0.56;(с) ./0.562=0.75. 
.64 (а) 12;(Ъ) 2520;(с) 720. 
.65 n=5. 
.66 60. 
.67 (а) 5040;(b) 720;(c) 240. 
.68 (а) 8400;(Ъ) 2520. 
.69 (а) 32805;(Ь) 11664. 
.70 26. 
.71 (а) 120;(b) 72;(c)12. 
.72 (а) 35;(b) 70;(с)45. 
-73 п=б. 
.74 210. 
.75 840. 
.76 (a) 42000;(Ь)7000. 
.77 (a) 120;(b) 12600. 
.78 (а) 150;(b) 45;(с) 100. 
.79 (а) 17; (Ь)163. 
.81 2.9210. 
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169 
6.83 (a) EA i (b) збо) 42509) 5525 A 
171 
6.84 1506: 
6.85 (а) 0.59049; (Ь) 0.32805; (с)0.08866. 


6.86 (b) Ce) Z, 


6.87 (а) 8; (b) 78;(с) 86; (4) 102;(e) 20; (£) 142. 


1 
6.90 3 
6.91 1/3838380. 
6.92 (а) 658007 № 1; (Ъ) 91389 ЊК 1; (с) 9879 H 1. 
6 


.93 (а) 649739 № 1; (Ь) 71192 1;(с) 4164 H 1;(d) 693 Шт. 


11 
6.94 22. 

1 
6.95 2. 
第 七 章 


7.35 (а) 5040;(b) 210;(с) 126;(d) 165;(е) 6. 
7.36 (а) 4 +74 р +210452 + 354% р + 3543 р* +2142 р5 + 79р + р? 
(b) g + 104 + 4546 р? + 12047 рэ + 2104$ р* + 252455 + 210g4p + 120437 + 45028 + 109р? + 
p” 


737 (а) O O 03509) ууз е) 13,00 уа) 二 


7.38 (a) 24;(b) 21 


7.39 (а) 二;(b) Elo 11,04) 5 


7.40 


7.41 


7.42 


ч 


‚43 


44 


.45 
-47 
‚49 
„50 
.51 
‚52 
„53 
‚54 
.35 
‚56 
57 
.58 
„59 
‚60 
‚61 
‚62 
‚ 63 
‚64 
‚65 
‚66 
„67 
‚68 
‚69 
‚70 
‚71 


3 33 43 了 4 ә ә ҹә м 


~] 


.72 
7.73 


7.74 


„75 


‚77 
‚78 
‚79 


ч ч м ч 


7.80 


(а) 250;(Ь) 25;(с) 500. 


17 l 
(а) 620) 324° 


64 
243` 
193 


512` 
32,192, ‚40 ‚242 
(а) 2435(b) 543C 243209) 543: 


(а) 42;(b) 3.550;(с) -0.1127;(d) 2.927. 

(а) Npaq(q ~ p): (b) Npa(1-6pg)+3N2p202. 

(а) 1.5 和 -1.6;(b) 72 和 90. 

(а) 75.4;(Ь) 9. 

(а) 0.8767; (Ъ) 0.0786; (с) 0.2991. 

(а) 0.0375;(b) 0.7123; (с) 0.9265;(4) 0.0154;(е) 0.7251; (#) 0.0395. 
(а) 0.9495; (Ь) 0.9500; (с) 0.6826. 

(а) 0.75;(Ь) ~ 1.86; (с) 2.08; (4) 1.625 8 0.849; (е) +1.645. 

– 0.995. 

(а) 0.0317; (Ь) 0.3790; (с) 0.1989. 

(а)20;(Ь) 36; (с) 227; (4) 40. 

(а) 93% ;(Ь) 8.1%; (с) 0.47%; (4) 15%. 

84. 

(а) 61.7%; (b) 54.7%. 

(а) 95.4%; (b) 23.0%; (с) 93.3%. 

(а) 1.15;(Ь) 0.77. 

(а) 0.9962; (Ь) 0.0687; (с) 0.0286; (4) 0.0558. 

(а) 0.2511; (Ь) 0.1342. 

(а) 0.0567; (Ь) 0.9198; (с) 0.6404; (4) 0.0079. 

0.0089. 

(а) 0.04979; (Ь) 0.1494; (с) 0.2241; (9) 0.2241; (е) 0.1680; (£) 0.1008. 
(а) 0.0838; (Ь) 0.5976; (с) 0.4232. 

(а) 0.05610; (b) 0.06131. 

(а) 0.00248; (Ь) 0.04462; (с) 0.1607; (4) 0.1033; (е) 0.6964; (#) 0.0620. 
(а) 0.08208; (Ь) 0.2052; (с) 0.2565; (4) 0.2138; (е) 0.8911; (f) 0.0142. 


5 _5_ 
(а) 3888;(b) 324: 
(а) 0.0348;(b) 0.000295. 
1 
16` 

4 

p(X)= | М :0.32*4.0.684-X. 期 望 频数 分 别 为 32,60,43,13 和 2. 
期 望 频数 分 别 为 1.7,5.5,12.0,15.9,13.7,7.6,2.7 和 0.6. 
期 望 频数 分 别 为 1.1,4.0, 11.1,23.9, 39.5, 50.2,49.0,36.6,21.1,9.4,3.1 和 1.0. 
期 望 频数 分 别 为 41.7,53.4,34.2,14.6 和 4.7. 


0.61е 70:61 
p(X)= “X17 一 :期望 频数 分 别 为 108.7,66.3,20.2,4.1 和 0.7. 
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8.21 
8.22 
8.23 
8.24 
8.25 


(а) 9.0;(b) 4.47; (с) 9.0; (4) 3.16. 

(а) 9.0; (Ь) 4.47; (с) 9.0; (4) 2.58. 

(а) их = 22.40 31, ох = 0.008 3; (b) иҗ = 22.40 F, ox = 稍 小 于 0.008 T. 
(а) ux = 22.40 3С, оҳ =0.008 克 ;(b) иу =22.40 Уб, су = 0.0057 X. 

(а) 237; (Ы) 2; (с) 无 ;(d) 34. 


.26 (а) 0.4972;(b) 0.1587;(с) 0.0918;(d) 0.9544. 
.27 (а) 0.8164;(b) 0.0228;(с) 0.0038; (4) 1.0000. 
28 0.0026. | 

.34 (а) 0.0029; (Ь) 0.9596; (с) 0.1446. 

.35 (а) 2;(Ь) 996; (с) 218. 

.36 (а) 0.0179; (Ь) 0.8664; (с) 0.1841. 

.37 (а) 6;(Ь) 9; (с) 2; (4) 12. 

39 (а) 19;(Ь) 125. 

40 (а) 0.0077; (Ь) 0.8869. 

41 (а) 0.0028; (b) 0.9172. 

.42 (а) 0.2150; (Ь) 0.0064,0.4504. 

.43 0.0482. 

.44 0.0188. 

.45 0.0410. 

.47 (а) 118.79 Œ; (b) 0.74 Æ. 

.48 0.0228. 

49 (а) 7.2;(Ь) 8.4, 

50 (а) 106; (Ь) 4. 

.S1 159. 

52 (а) 78.7; (Ь) 0.0090. 
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9.21 (а) 9.5 千克 ;(b) 0.74 千克 ?;(c) 分 别 为 0.78 千克 和 0.86 FE. 

9.22 (а) 1200 小 时 ;(b) 105.4 小 时 . 

9.23 (а) 知 样 本 容量 分 别 为 30, 50 和 100 时 ,总 体 标准 差 的 估计 为 101.7 小 时 , 101.0 小 时 和 100.5 小 时 ; 
各 种 情况 下 , 总 体 均值 的 估计 皆 为 1200 小 时 . 

9.24 (а) 11.09+0.18 吨 ;(b) 11.09+0.24 mt, 

9.25 (а) 0.72642 + 0.000095 英寸 ; (b) 0.72642 + 0.000085 英寸 ; (cj 0.72642 + 0.000072 英寸 ; (а) 
0.72642 + 0.000060 英寸 . 

9.26 (а) 0.72642 + 0.000025 英寸 ; (b) 0.000025 英寸 . 

9.27 (а) 至 少 97;(b) 至 少 68;(c) 至 少 167;(d) #222225. 

9.28 (а) 275 385; (b) Æ 271; (c) 至 少 666;(d) 至 少 900. 

9.29 (а) 2400 +45 Е, 2400 + 59 磅 ;(b) 87.6%. 

9.30 (а) 0.70+0.12,0.69+0.11;(b) 0.70+0.15,0.68 +0.15; (e) 0.70+0:18,0.67 +0.17. 

9.31 (а) 至 少 323; (b) 至 少 560;(c) 至 少 756. 

9.32 (а) 16400;(b) 27100; (с) 38420; (4) 66000. 

9 

9 

9 

9 

9 

9 
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-33 (а) 1.07+0.09 小 时 ;(b) 1.07+0.12 小 时 . 

-34 (а) 0.045+0.073;(b) 0.045 *0.097;(с) 0.045+0.112. 
-35 (а) 63.8+0.24 磅 ;(b) 63.8+0.31 В. 

-36 (а) 180+24.9 磅 ;(b) 180 +32.8 磅 ;(c) 180+38.2 @. 
.37 8.6 磅 . 

.38 (а) 至 少 4802;(b) 至 少 8321;(c) 至 少 11250. 
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10.29 (a) 0.2606. 
10.30 (а) 着 抽取 到 的 红 球 数 在 22 到 42 之 间 , 则 接受 假设 ， 否则 拒绝 假设 ; 

(b) 0.99; (с) 若 抽 取 到 的 红 球 数 在 24 到 40 之 间 ， 则 接受 假设 , 否则 拒绝 假设 . 
10.31 (а) Ho:p=0.5, Hi:p>0.5;(b) 单 边 检验 ; 

(с) 震 抽取 到 的 红 球 数 大 于 39, 则 拒绝 Ho 否则 接受 它 、 


10.32 
10.33 
10.34 
10.35 
10.36 
10.37 
10.38 
10.39 
10.43 
10.44 
10.45 
10.46 
10.47 
10.48 
10.49 


10.50 


10.51 
10.54 
10.55 
10.56 
10.57 


(d) 若 抽 取 到 的 红 球 数 大 于 41, 则 拒绝 Ho 否则 接受 它 . 

(а) 在 水 平 0.05 下 ,不 能 拒绝 假设 ;(b) 在 水 平 0.05 下 可 以 拒绝 假设 . 
不 管 是 用 双边 检验 还 是 单 边 检验 , 在 水 平 0.01 下 都 不 能 拒绝 假设 . 
用 单 边 检验 ,在 两 个 水 平 下 均 可 拒绝 此 声明 . 

用 单 边 检验 , 在 水 平 0.05 下 ,结果 显著 ,但 在 水 平 0.01 下 不 显著 . 
是 , 若 均 用 单 边 检验 , 在 两 个 水 平 下 , 结论 都 很 显著 . 

无 论 采 用 双边 还 是 单 边 检验 , EKE 0.05 下 ,结果 都 是 显著 的 . 

用 单 边 检验 , 在 水 平 0.01 下 ,结果 显著 .用 双边 检验 则 得 不 到 此 结论 ， 
(а) 0.3112;(b) 0.0118;(c) 0;(d) 0;(e) 0.0118. 

(а) 8.64+0.96 179]; (b) 8.64+0.83 将 司 ;(c) 8.64+0.63 #89]. 
控制 上 限 分 别 为 :(a) 6 个 不 合格 品 ;(b) 4 个 不 合格 品 ， 

(a) 是 ;(b) F. 

在 两 个 显著 性 水 平 下 进行 单 边 检验 均 表 明 :品牌 В 比 品牌 A 要 好 . 
单 边 检验 表明 在 水 平 0.05 Е, 差异 显著 ,但 在 水 平 0.01 下 不 显著 . 
单 边 检验 表明 :在 两 个 水 平 下 , 新 肥料 都 比 原来 的 好 . 

(а) 双边 检验 表明 ,在 水 平 0.05 下 ,质量 间 没 有 差异 ; 

(b) 单 边 检验 表明 ,在 水 平 0.05 下 , B 不 比 4 好 . 

(а) 双边 检验 表明 ,在 水 平 0.05 下 ,不 能 拒绝 等 比例 的 假设 ，; 

(b) 单 边 检 验 表明 ,在 水 平 0.05 下 , A 中 红 球 的 比例 比 B 要 大 . 

(а) 9;(b) 10; (с) 10;(d) 8. 

(а) 否 ;(b) Æ; (с) T. 

(а) 是 ;(b) 是 ;(c) Ж. 

(a) 是 ;(b) 是 ;(c) 是 . 

(а) 否 ;(b) 否 ;(c) 否 . 
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11.20 
11.21 
11.22 
11.23 
11.24 
11.25 
11.26 
11.27 
11.28 
11.29 
11.30 
11.31 
11.32 
11.33 
11.34 
11.35 
11.36 
11.37 
11.38 
11.39 
11.40 
11.41 
11.42 


(а) 2.60;(b) 1.75;(с) 1.34;(d) 2.95;(е) 2.13. 

(а) 3.75;(Ь) 2.68;(с) 2.48;(d) 2.39; (е) 2.33. 

(а) 1.71;(Ь) 2.09; (с) 4.03;(4) ~ 0.128. 

(а) 1.81; (Ь) 2.76; (с) -0.879; (4) – 1.37. 

(а) +4.60;(Ь) +3.06; (с) +2.79;(4) +2.75; (е) £2.70. 

(а) 7.38 +0.82 克 ;(b) 7.38 +1.16 $. 

(а) 7.38 + 0.73 Œ; (b) 7.38 + 0.76 3. 

(а) 0.298 + 0.030 ЖУ; (Ь) 0.298+ 0.049 Ж. 

双边 检验 表明 ,无 论 是 在 水 平 0.05 还 是 0.01 Е, 都 不 能 证 明 平 均 寿 命 已 经 改变 ， 

单 边 检验 表明 , 无论 是 在 水 平 0.05 还 是 0.01 下 ,均值 都 未 减少 

两 个 水 平 下 的 双边 检验 均 表 明 , 此 产品 不 满足 所 需 的 规格 . 

两 个 水 平 下 的 单 边 检验 均 表 明 , 铜 的 平均 含量 比 所 需 的 规格 要 高 

单 边 检验 表明 , 若 显 著 性 水 平 采用 0.01, 则 此 工序 不 应 被 引进 ,但 车 采用 0.05, 则 应 被 引进 . 
单 边 检 验 表 明 , 在 显著 性 水 平 0.05 下 ,品牌 A 比 品牌 B 好 . 

在 显著 性 水 平 0.05 下 采用 双边 检验 , 我们 并 不 能 从 样本 中 得 到 两 种 型 号 在 酸度 上 存在 差异 的 结论 . 
在 显著 性 水 平 0.05 下 采用 单 边 检验 ,可 以 认为 第 一 组 不 比 第 二 组 好 . 

(а) 21.0;(Ь) 26.2;(с) 23.3. 

(а) 15.5;(b) 30.1;(c) 41.3;(d) 55.8. 

(а) 20.1;(b) 36.2;(с) 48.3;(4) 63.7. 

(а) x1=9.59 和 у2- 34.2. 

(а) 16.0; (Ь) 6.35; (с) 假设 两 个 尾 面 积 相等 , 则 Xi=2.17 和 у2=14.1. 
(а) 87.0 到 230.9 小 时 ;(b) 78.1 到 288.5 小 时 、 

(а) 95.6 到 170.4 小 时 ;(b) 88.9 到 190.8 小 时 . 


11.43 (а) 122.5;(b) 179.2. 

11.44 (а) 207.7;(b) 295.2. 

11.46 (а) 106.1 21] 140.5 小 时 ;(b) 102.1 到 148.1 小 时 . 

11.47 105.5 到 139.6 小 时 . 

11.48 依据 给 定 的 样本 ,在 任何 水 平 下 , 变异 的 明显 增加 都 不 显著 . 

11.49 变异 的 明显 减少 在 水 平 0.05 下 显著 , 但 在 水 平 0.01 下 不 显著 . 
11.50 (а) Fo.95=3.07;(b) Fo.g9=4.02;(c) Fo os=2.11;(d) Ер 59 = 2.83. 
11.51 Ев =1.95, Ні. 

11.52 样本 1 的 变量 在 水 平 0.05 F, 显著 大 些 , 但 在 水 平 0.01 FXE. 
11.53 (а) 是 ;(b) B. 
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12.26 在 任何 水 平 下 ,假设 都 不 能 被 拒绝 . 

12.27 结论 如 前 . 

12.28 新 教师 并 没有 采用 其 他 人 的 记分 方法 . (事实 上 ,成 绩 比 平均 成 绩 高 可 能 是 由 于 教学 水 平 或 低 标 准 两 
方面 的 原因 所 致 ) 

12.29 没有 理由 拒绝 硬币 均匀 的 假设 . 

12.30 在 任何 水 平 下 ,都 没有 理由 拒绝 假设 . 

12.31 (а) 分 别 为 10,60 和 50; 
(b) 在 水 平 0.05 下 ,不 能 拒绝 结论 和 所 期 望 之 相同 的 假设 . 

12.32 在 水 平 0.05 下 ,差异 是 显著 的 . 

12.33 (а) 拟 合 得 好 ;(b) F. 

12.34 (а) 拟 合 得 “很 好 ”;(b) 在 水 平 0.05 F, 拟 合 得 不 好 

12.35 (а) 在 水 平 0.05 F, 拟 合 得 很 不 好 ;因为 二 项 分 布 为 数据 提供 了 一 个 很 好 的 拟 合 ， 这 和 习题 12.33 的 
结论 一 致 . 
(b) 拟 合 得 好 ,但 不 是 “很 好 ”. 

12.36 ”在 水 平 0.05 下 ,拒绝 假设 ,但 在 水 平 0.01 FRA. 

12.37 结论 如 前 . 

12.38 在 任何 水 平 下 , 都 不 能 拒绝 假设 . 

12.39 在 水 平 0.05 下 不 能 拒绝 假设 . 

12.40 ”在 两 个 水 平 下 都 可 以 拒绝 假设 . 

12.41 在 两 个 水 平 下 都 应 拒绝 假设 ， 

12.42 在 两 个 水 平 下 都 不 能 拒绝 假设 . 

12.49 (a)0.3863( 未 修正) 和 0.3779( Yates 修正 ). 

12.50 (а) 0.2205,0.1985( 修 正 );(b) 0.0872,0.0738( 修 正 ). 

12.51 0.4651. 

12.54 (a) 0.4188,0.4082( 修 正 ). 

12.55 (а) 0.2261,0.2026( 修 正 );(b) 0.0875,0.0740( 修 正 ). 


12.56 0.3715. 

第 十 三 章 

13.24 (а) 4;(b) бу(с) 2З (д) 10.5;(е) 6;(0) 9. 

13.25 (2,1). 

13.26 (а) 25 + Y=4;(b) X RE =2, Y E -4;(с) -2, -6. 
13.27 Y=ŽX-382X-3Y=9, 

13.28 (a) вж, Y REE = -4;(b) ЗХ-5ү-=1]1. 


13.29 (а) – 2:06) 52 (с)4Х +3Ү=32. 


13.30 


13.31 


13.32 


13.33 
13.35 
13.36 


13.37 


13.38 
13.39 
13.40 


X/3+ Y/(-5)=1% 5X-3Y=15. 


(a) F=- T +32; (b) 176°; (с) 208. 
(a) Y= -442x Y= -0.333+0.714X; 


(b) X=1+ 方 ,或 X=1.00+1.29Y. 
(а) 3.24;8.24;(b) 10.00. 


(b) Y=29.13+0.661X;(c) Х = —14.39+1.15Y;(d) 79;(e) 95. 


(b) 出 生 率 =16.6--0.357x 年 导 ; 
(с) 


+ 
с чл A чо N һе © 
: 





(d) 出 生 率 预测 值 = 13.0. 
(b) +ҖЖ&=2604 + 102 x 年 号 . 
(с) 


+ 
A 
чр 


к= 
ч 
м 
ав) 
= [кә 


y% 


2667 
2742 
2823 
2885 
2968 
3022 
3185 
3306 
3431 
3541 
3652 
3762 


(d) 不 小 于 85 的 年 号 的 预测 值 =4644000 


Ү=5.51+3.20(Х-3)+0.733(Х—-3)?°5ў Y=2.51-1.20X +0.733х2. 


16.6143 
16.2571 
15.9000 
15.5429 
15.1857 
14.8286 
14.4714 


拟 合 值 


2604.41 
2706.40 
2808.38 
2910.37 


3012.35 
3114.34 
3216.33 
3318.31 
3420.30 
3522.28 
3624.27 
3726.26 


(b) р =41.77 -1.096 V +0.08786 V?; (c) 170 ÆR, 516 ÆR. 


(b) 差 = -2.68 +1.39x 6. 
(c) 
= 
| 1 
2 | 
3 


= 
м 
һә 
о 


pæ 
O 
~] 
心 


1990 7 


06 [зв 
; 


65 


-2.09 


‚45 


-0 











– 0.0142 
0.0428 
0.0000 

— 0.0428 
0.0142 

— 0.0285 


62.5897 
35.6037 
14.6177 


-25.3683 
— 44.3543 
– 92.3403 
— 31.3263 
~ 12.3124 


10.7016 
18.7156 
27.7296 
35.7436 


拟 合 值 
一 2.68 
-1.28 
0.11 
1.51 
2.90 
4.29 
5.69 
7.08 


-0.22 
-0.56 
-0.56 
— 0.24 


– 0.85 


13.41 (Ь) 比值 =0.965+0.0148 Xx 年 号 . 
(с) 
(d) 比 值 预 测 值 = 1.08. 真实 比值 =1.04. 
13.42 (Ъ) Я#=-2.63+1.35х +0.0064zx? 
(а) 1995 年 的 预测 差 为 -2.63+1.35x7.5+0.0064X56.25= 7.86. 
13.43 (b) Y=32.14X1.427 或 Y=32.14X10%154X 或 Y=32.14X e03556X 其 中 oe 27 718... 
第 十 四 章 
14.40 (b) Y=4.000+0.500X;(c) X=2.408+0.612Y. 
14.41 (a) 1.304;(b) 1.443. 
14.42 (а) 24.50;(b) 17.00;(с) 7.50. 
14.43 0.5533. 
14.45 1.5. 
14.46 (а) 0.8961; (Ь) Ү=80.78+1.138Х; (с) 132. 
14.47 (а) 0.958; (Ь) 0.872. 
14.48 (а) Ү=0.8Х +12;(Ь) X=0.45Y +1. 
14.49 (а) 1.60; (Ь) 1.20. 
14.50 +0.80. 
14.51 75%. 
14.53 (а) ~ 0.9203. 
14.54 (а) Ү= 18.04 –1.34Х, Ү=51.18-2.01Х. 
14.58 0. 5440. 
14.59 (а) Ү=4.44Х – 142.22; (b) 分 别 为 141.9 磅 和 177.5 В. 
14.60 (а) 16.92 Е; (Ь) 2.07 英寸 
14.62 0.946. 
14.63 0.269. 
14.64 (а) 是 ;(b) T. 
14.65 (а) #;(Ь) Ж. 
14.66 (а) 0.2923 #1 0.7951; (Ь) 0.1763 ЯП 0.8361. 
14.67 (а) 0.3912 和 0.7500; (Ь) 0.3146 和 0.7861. 
14.68 (а) 0.7096 #1 0.9653; (Ь) 0.4961 #1 0.7235. 
14.69 (а) 是 ;(b) ©. 
14.70 (а) 2.00 +0.21;(Ь) 2.00 + 0.28. 
14.71 (а) 用 单 边 检验 ,拒绝 假设 ，; 
(b) 用 单 边 检验 ,不 拒绝 假设 . 
14.72 (a) 37.0+3.28;(b) 37.0+4.45. 
14.73 (а) 37.0+0.69;(Ь) 37.0+0.94. 


(а) 1995 年 差 的 预测 值 为 -2.68+1.39x7.$S=7.75., 趋 势 好 象 不 连续 . 


(d) 387. 





14.74 (а) 1.138+0.398;(b) 132.0+16.6;(с) 132.0 + 5.4. 
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15.26 (а) X3= b3.12 + 631.2X1 + b32.1 X2; 
(b) X4 = b4.1235 + b41.235X1 + b42.135 Хә + b43.125 Хз. 
15.28 (а) X;3=61.40—3.65X1+2,.54X,;(b) 40. 
15.29 (а) Хз -– 74=4.36(Х, – 6.8) +4.04(Х, – 7.0) 2 Х = 16.07 +4.36Х, +4.04Х,;(Ь) 84 和 66. 
15.31 3.12. 
15.32 (а) 5.883; (Ь) 0.6882. 
15.33 0.9927. 
15.34 (а) 0.7567; (Ь) 0.7255; (с) 0.6810. 
15.37 (а) 0.5950; (Ь) – 0.8995; (с) 0.8727. 
15.38 (а) 0.2672; (Ь) 0.5099; (с) 0.4026. 
15.42 (а) Х,=6Х;+3Х,-4Х; – 100;(Ь) 54. 
15.43 (а) 0.8710; (Ь) 0.8587; (с) – 0.8426. 
15.44 (а) 0.8947; (Ь) 2.680. 
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16.21 ”两 个 水 平 下 ,产量 间 都 存在 显著 差异 . 

16.22 两 个 水 平 下 ,轮胎 间 都 不 存在 显著 差异 ， 

16.23 ”在 水 平 0.05 下 ,教学 方法 间 存 在 显著 差异 , 但 在 水 平 0.01 FREE. 

16.24 ”在 水 平 0.05 下 ,品牌 间 存在 显著 差异 ,但 在 水 平 0.01 下 不 存在 . 

16.25 ”两 个 水 平 下 ,成 绩 间 都 存在 显著 差异 . 

16.26 ”工人 间或 机 器 间 都 不 存在 显著 差异 . 

16.27 答案 与 习题 16.26 相同 . 

16.28 在 水 平 0.05 下 ,由 于 玉米 品种 不 同 而 存在 显著 差异 ,但 土壤 不 同 不 会 引起 显著 差异 . 

16.29 在 水 平 0.01 F, 玉米 品种 与 土壤 的 不 同 均 不 会 引起 显著 差异 . 

16.30 ЖЖ 0.05 下 ,轮胎 和 汽车 的 不 同 均 会 引起 显著 差异 . 

16.31 ”在 水 平 0.01 下 ,轮胎 和 汽车 的 不 同 均 不 会 引起 显著 差异 . 

16.32 ЖЖ 0.05 下 ,教学 方法 间 存 在 显著 差异 ,但 学 校 的 不 同 不 会 引起 显著 差异 . 

16.33 无论 头 发 颜色 还 是 身高 , 都 不 会 引起 显著 差异 . 

16.34 ”答案 与 习题 16.33 相同 . 

16.35 ЖЖҰ 0.05 下 ,地 区 的 不 同 会 引起 显著 差异 ,但 肥料 的 不 同 不 会 引起 显著 差异 . 

16.36 ”在 水 平 0.01 下 ,地 区 与 肥料 的 不 同 都 不 会 引起 显著 差异 . 

16.37 工人 同 存 在 显著 差异 ,但 机 器 间 不 存在 . 

16.38 ”肥料 或 土壤 都 不 存在 显著 差异 . 

16.39 BREI 16.38. 

16.40 ”身高 ,头发 颜色 或 出 生地 的 不 同 均 不 会 引起 成 绩 上 的 显著 差异 . 

16.41 准 鸡 品 种 及 第 一 种 化 学 药品 的 数量 均 会 引起 显著 差异 , {Н Ж Е НЫ ПЕЛЕ ЕШ Ж: В| 
起 显著 差异 . 

16.42 不 同 的 电缆 可 能 引起 电缆 强度 上 的 显著 差异 , 但 不 同 的 工人 , 机 器 或 公司 不 会 引起 电缆 强度 的 显著 
差异 . 

16.43 ”任何 水 平 下 都 不 存在 显著 差异 . 

16.44 ”任何 水 平 下 都 不 存在 显著 差异 . 

16.46 ЖЖ 0.05 F, 工人 的 熟练 程度 与 其 智商 均 可 能 引起 测验 成 绩 的 显著 差异 ， 

16.47 在 水 平 0.01 下 ,工人 的 熟练 程度 对 测验 成 绩 的 影响 不 显著 ,但 智商 对 测验 成 绩 的 影响 却 很 显著 

16.48 和 学生 所 处 的 地 区 的 不 同 对 他 们 的 成 绩 的 影响 不 显著 ,但 智商 对 测验 成 绩 的 影响 却 很 显著 ， 

16.49 答案 同 习 题 16.48. 

16.53 ”在 水 平 0.05 F, 化 学 药品 和 地 区 的 不 同 都 会 引起 显著 差异 ， 





16.54 ЖЖ 0.05 下 ,地 区 的 不 同 会 引起 显著 差异 ,但 肥料 的 不 同 不 会 引起 显著 差异 . 
16.55 ”在 水 平 0.01 下 ,地 区 和 肥料 的 不 同 均 不 会 引起 显著 差异 . 

16.56 ”因子 1, 因子 2 或 处 理 А,В 和 C 都 不 会 引起 显著 差异 . 

16.58 因子 和 处 理 的 不 同 均 不 会 引起 显著 差异 . 
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17.26 Ж 0.05 下 存在 显著 差异 ,但 水 平 0.01 FREE. 
17.27 是 . 
17.28 ”在 水 平 0.05 下 此 课程 设计 有 效 . 
17.29 ”在 水 平 0.05 下 , 可 以 拒绝 销售 额 增长 的 假设 . 
17.30 Ж. 
17.31 (а) 拒绝 ;(b) 接受 ;(c) 接受 ;(d) 拒绝 . 
17.34 ”在 水 平 0.05 下 没有 差异 . 
17.35 B. 
17.36 (а) 是 ;(b) Æ. 
17.37 Ж. 
17.38 (а) Æ; (b) Е. 
17.41 3. 
17.42 6. 
17.49 ”任何 水 平 下 都 不 存在 显著 差异 . 
17.50 ”在 水 平 0.05 下 差异 显著 ,但 在 水 平 0.01 FREF., 
17.51 在 水 平 0.05 下 差异 显著 ,但 在 水 平 0.01 FREF. 
17.52 两 个 水 平 下 ,成 绩 间 都 存在 显著 差异 . 
17.55 (а) 8;(b) 10. 
17.56 (а) 10;(b) 水 平 0.05 下 反映 是 随机 的 . 
17.62 在 水 平 0.05 下 样本 不 随机 .存在 过 多 的 游程 , 可 能 存在 循环 因素 
17.63 在 水 平 0.05 下 样本 不 随机 .存在 过 少 的 游程 , 可 能 存在 趋势 因素 . 
17.64 在 水 平 0.05 下 ,数字 序列 是 随机 的 . 
17.65 (а) 在 水 平 0.05 下 ,数字 序列 是 随机 的 ， 
(b) 在 水 平 0.05 下 ,数字 序列 是 随机 的 . 
17.69 (a)0.67;(b) 两 个 裁判 的 判断 不 是 很 一 致 . 
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18.22 (а) 人 循环 ;(b) 季节 ;(c) 长 期 ;(d) 不 规则 ; (е) 长 期 . 


18.23 (а) 0.5, -0.5,—0.5,0.5,0.5, – 0.5, –0.5,0.5; (Ь) 0, -4,0, 4,0, 一 T0; (e) 0,0,0,0,0,0; 
1 1 


(d) 1,0, 5,0,6. 

18.28 (b) 0, -0.5,0,0.5,0, -0.5,0;(c) – 1, - 
(d) 0,0, 0,0,0. 

18.30 (а) 20; (Ь) 21; (с) 196. 
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414 1 1 1. 
6,'6'6' 6? 6 


19.16 样本 均值 为 :13.25 14.50 17.25 14.50 13.50 14.75 13.75 15.00 15.00 17.00 
样本 极 差 为 .5 9 5 6 8 9 10 5 5 7 


X =14.85, R =6.9. 


19.17 o 的 估计 值 为 1.741.LCL= 450.7, UCL=455.9. 没 有 样本 均值 落 在 控制 限 之 外 . 
19.18 5 


19.19 图 表明 变动 已 经 减少 .新 的 控制 限 为 ТЛ = 452 Q тст — are л т е оп OLO die 一 、 mn 


19. 
19. 
19. 
19. 
19. 
19. 


19. 


19. 


19. 


19. 


19 


20 


27 


28 


29 


‚30 


在 目标 值 附 近 . 

控制 限 为 LCL= 1.980, UCL 一 2.017. 第 4,5,6 阶段 的 值 不 能 通过 检验 5. 第 15 到 20 阶段 的 值 不 能 

通过 检验 4. 它 们 中 的 每 一 个 都 可 看 作 是 上 下 连续 波动 的 14 个 点 的 结束 点 . 

Cpg =0.63 .单位 缺陷 数 ppm = 32487. 

Cpr =1.72. 单 位 缺陷 数 ppm< 1. 

中 心 线 =0.006133,LCL=0,UCL=0.01661; 过 程 可 控 ;ppm= 6133. 

中 心 线 =3.067,LCL=0,UCL=8.304. 

0.032 0.027 0.032 0.024 0.024 0.027 0.032 0.032 0.027 0.024 

0.032 0.024 0.027 0.024 0.027 0.024 0.027 0.027 0.027 0.027 

FPO = Х = 349.9. 

移动 极 差 为 :0.0 0.2 0.6 0.8 0.4 0.3 0.1 0.4 0.4 0.9 0.2 1.1 0.5 1.5 2.8 
1.6 0.3 0.1 1.2 1.9 0.2 1.2 0.9 

上 述 移动 极 差 的 均值 = Rx = 0.765. 


И.Х +3 ,其 中 а, 是 控制 图 常数 ,可 通过 各 种 表 查 到 ,此 题 中 为 1.128， 


LCL = 347.9, UCL = 352.0. 

EWMA 图 表明 过 程 均值 都 低 于 目标 值 .样本 12 和 13 的 均值 落 在 控制 下 限 之 外 .13 以 上 的 样本 均值 
都 在 控制 下 限 之 上 ,但 是 ,过 程 均值 还 是 始终 低 于 目标 值 . 

带 状 图 并 没有 指出 有 点 超出 控制 .但 是 ,如 习题 19.20 所 示 , 有 连续 14 个 点 围绕 中 心 线 上 下 波动 .这 
是 由 带 状 图 本 身 的 原因 引起 的 . 

20 个 控制 下 限 为 :0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.38 0.00 0.00 0.00 0.00 
0.00 0.38 0.00 0.00 0.38 0.00 0.38 0.38. 

20 个 控制 上 限 为 :9.S2 9.52 9.52 9.52 9.52 7.82 8.46 7.07 7.82 8.46 9.52 9.52 
9.52 7.07 9.52 9.52 7.07 9.52 7.07 7.07. 
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.3989 
.3970 
.3910 
.3814 
- 3683 


-3521 
. 3332 
‚3123 
‚2897 
‚2661 


‚2420 
-2179 
‚ 1942 
‚1714 
‚ 1497 


‚ 1295 
‚1109 
‚0940 
‚0790 
‚0656 


‚0540 
‚0440 
‚0355 
‚0283 
‚0224 


‚0175 
‚0136 
‚0104 
‚0079 
‚0060 


. 0044 
‚0033 
‚0024 
‚0017 
‚0012 


‚0009 
‚0006 
‚0004 
‚0003 
‚0002 


标准 正 态 分 布 的 分 布 密度 值 
1 2 3 4 
‚3989 ‚3989 3988 ‚3986 
‚3965 ‚3961 ‚3956 ‚3951 
‚3902 -3894 . 3885 ‚3876 
‚3802 ‚3790 ‚3778 ‚3765 
‚3668 -3653 ‚3637 -3621 
‚3503 ‚ 3485 ‚3467 ‚3448 
‚3312 ‚3292 ‚3271 ‚3251 
‚3101 ‚3079 ‚3056 ‚ 3034 
‚2874 „2850 ‚2827 ‚2803 
‚2637 ‚2613 .2589 .2565 
‚2396 ‚2371 ‚2347 ‚2323 
‚2155 ‚2131 ‚2107 ‚2083 
‚1919 1895 ‚1872 . 1849 
.1691 .1669 .1647 .1626 
.1476 .1456 -1435 ‚1415 
‚1276 ‚1257 .1238 .1219 
.1092 ‚1074 ‚1057 ‚1040 
‚0925 ‚0909 ‚0893 ‚0878 
‚0775 ‚0761 ‚0748 ‚0734 
‚0644 ‚0632 ‚0620 ‚0608 
„0529 -0519 ‚0508 ‚0498 
‚0431 ‚0422 ‚0413 ‚0404 
‚0347 ‚0339 -0332 .0325 
‚0277 ‚0270 ‚0264 ‚0258 
‚0219 ‚0213 ‚0208 ‚0203 
‚0171 ‚0167 ‚0163 ‚0158 
‚0132 ‚0129 ‚0126 ‚0122 
‚0101 ‚0099 ‚0096 ‚0093 
‚0077 ‚0075 ‚0073 ‚0071 
.0058 .0056 .0055 -0053 
‚0043 ‚0042 ‚0040 ‚0039 
‚0032 ‚0031 -0030 ‚0029 
‚0023 ‚0022 ‚0022 ‚0021 
‚0017 .0016 .0016 .0015 
.0012 -0012 .0011 -0011 
‚0008 -0008 ‚0008 ‚0008 
‚0006 ‚0006 ‚0005 ‚0005 
‚0004 ‚0004 „0004 ‚0004 
.0003 .0003 .0003 ‚0003 
‚0002 ‚0002 ‚0002 ‚0002 


5 


‚3984 
‚3945 
.3867 
.3752 
.3605 


.3429 
-3230 
‚3011 
‚2780 
‚2541 


‚2299 
‚2059 


‚1826 
‚1604 
‚1394 


‚1200 
‚1023 
‚0863 
.0721 
‚0596 


‚0488 
‚0396 
‚0317 
‚0252 
‚0198 


‚0154 
‚0119 
‚0091 


‚0069 


‚0051 


‚0038 
‚0028 


‚0020 
‚0015 
‚0010 


‚0007 
‚0005 
‚0004 
‚0002 
‚0002 


.3982 
.3939 
. 3857 
‚3739 
‚3589 


3410 
‚3209 
. 2989 
‚2756 
.2516 


‚2275 
‚2036 
‚1804 
‚1582 
‚1374 


‚1182 
. 1006 
‚0848 
‚0707 
‚0584 


‚0478 
‚0387 
-0310 
‚0246 
‚0194 


‚0151 
‚0116 
‚0088 
‚0067 
‚0050 


‚0037 
‚0027 
‚0020 
‚0014 
‚0010 


‚0007 
‚0005 
‚0003 
‚0002 
‚0002 


‚3980 
‚3932 
‚3847 
‚3725 
‚3572 


‚3391 
-3187 
.2966 
.2732 
.2492 


.2251 
.2012 
.1781 
.1561 
-1354 


‚1163 
‚0989 
‚08633 
‚0694 
‚0573 


‚0468 
.0379 
.0303 
.0241 
.0189 


‚0147 
-0113 
‚0086 
‚0065 
‚0048 


‚0036 
‚0026 
‚0019 
‚0014 
‚0010 


‚0007 
‚0005 
‚0003 
‚0002 
‚0002 


.3973 
.3918 
.3825 
.3697 
.3538 


.3352 
.3144 
.2920 
.2685 
.2444 


‚2203 
‚1965 
‚1736 
‚1518 
‚1315 


‚1127 
.0957 
.0804 
-0669 
.0551 


.0449 
.0363 
.0290 
.0229 
.0180 


.0139 
.0107 
.0081 
.0061 
‚0046 


‚0034 
‚0025 
‚0018 
‚0013 
‚0009 


‚0006 
.0004 
.0003 
.0002 
.0001 
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标准 正 态 分 布 的 随机 变量 
落 在 0 到 z 区 间 上 的 概率 值 


2 3 4 








ИШ 


Ф vV (о 一 


© © nN Ф©Ф a 


м Ww V ьӊ ы WwW „ы  „ B 


МӘ v v to N 


v МЮ NV N N 


М То Со tp т 


г ~ 分 布 的 下 侧 分 位 数 


(其 中 vy 为 自由 度 ) 
t .99 Ё .975 Ё .95 
31.82 12.71 6.31 
6.96 4.30 2.92 
4.54 3.18 2.35 
3.75 2.78 2.13 
3.36 2.57 2.02 
3.14 2.45 1.94 
3.00 2.36 1.90 
2.90 2.31 1.86 
2.82 2.26 1.83 
2.76 2.23 1.81 
2.72 2.20 1.80 
2.68 2.18 1.78 
2.65 2.16 1.77 
2.62 2.14 1.76 
2.60 2.13 1.75 
2.58 2.12 1.75 
2.57 2.11 1.74 
2.55 2.10 1.73 
2.54 2.09 1.73 
2.53 2.09 1.72 
2.52 2.08 1.72 
2.51 2.07 1.72 
2.50 2.07 1.71 
2.49 2.06 1.71 
2.48 2.06 1.71 
2.48 2.06 1.71 
2.47 2.05 1.70 
2.47 2.05 1.70 
2.46 2.04 1.70 
2.46 2.04 1.70 
2.42 2.02 1.68 
2.39 2.00 1.67 
2.36 1.98 1.66 
2.33 1.96 1.645 


4 к= к= = к= м = — — м = == p jb n 
+ „ь . я т ш я * + + а 中 b + Г 


р үр ү мл р 


‚08 


1.376 
1.061 
‚978 
.941 


.920 
.906 
.896 
‚889 
. 883 


‚879 
‚876 
‚873 
‚870 
‚868 


‚866 
‚865 
‚863 
‚862 
‚861 


‚860 
‚859 
858 
‚858 
‚857 


‚856 
‚856 
‚855 
‚855 
‚854 


„854 
.B51 
„848 
‚845 
‚842 





MRN 


100 


Ыы м 
щл © 
С Юю мм o о ш © ш © ы 


人 
М 
С^ моо àa o 


Xx” 分布 的 下 侧 分 位 数 

(其 中 ， 为 自由 度 ) 
X9 X975 X “95 Х 
6.63 5.02 3.84 2. 
9.21 7,38 5.99 4. 
11.3 9.35 7.81 6. 
13.3 1111 9.49 7. 
15.1 128 11.1 9 
16.8 144 126 10 
18.5 16.0 14.1 12 
20.1 17.5 15.5 13 
21.7 19.0 16.9 14 
23.2 20.5 18.3 16 
24.7 21.9 19.7 17 
26.2 23.3 21.0 18 
27.7 247 22.4 19 
29.1 26.1 23.7 21 
30.6 27.5 25.0 22 
32.0 28.8 26.3 23 
33.4 30.2 27.6 24 
34.8 31.5 28.9 26 
36.2 32.9 30.1 27 
37.6 34.2 31.4 28 
38.9 35.5 327 29 
40.3 36.8 33,9 30 
41.6 38.1 35.2 32 
43.0 39.4 36.4 33 
44.3 40.6 37.7 34 
45.6 41.9 38.9 35 
47.0 43.2 40.1 36 
48.3 44.5 41.3 37 
49.6 45.7 42.6 39 
50.9 470 43.8 4 
63.7 593 55.8 51 
76.2 71.4 67.5 63 
88.4 83.3 791 74 
100.4 95.0 90.5 85 
112.3 106.6 101.9 % 
124.1 118.1 113.1 107. 
135.8 129.6 124.3 118. 


ю б ль 5 ж л чш юм mm „ b 


a N u м Фф А PN 


л A A л 


© 
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10. 
11. 


12. 
13. 
14. 
16. 


17 


18. 
19. 
20. 
21. 
22. 


23 


24. 
26. 
27. 
28. 


29. 
30. 
31. 
32. 
33. 


34. 


46 


56. 
67. 


77. 
88. 
98. 
109, 


A e N кәе 


зз к So OO со 


© о a o 


ч с a A w 


= © 个 


* * * Ы в b я . + 
ш Ыы w эы Ww WW ш U w 


ч o Ww W ш 


ш wW ә» U w 





D М J œ D 


о о у (л 


© кш N ышы «дл 


2 
Xp 


X 205 
.0039 
.103 
.352 
.711 


.15 
.64 
.17 
.73 
.33 


ә М м ы юш 


.94 
.57 
.23 
89 
.57 


人 


‚26 
.96 
.67 
.39 


№ с э м 


jw 
= 
Hk 


X 2025 
‚0010 
‚0506 
.216 
.484 


.831 
1.24 
1.69 
2.18 
2.70 


3.25 
3.82 
4.40 
5.01 
5.63 


6.26 
6.91 
7.56 
8.23 
8.91 


9. 59 
10.3 
11.0 
11.7 
12.4 


13.1 
13.8 
14.6 
15.3 
16.0 


16.8 
24.4 
32.4 
40.5 


48.8 
57.2 
65.6 


74.2 


л Ny N о 


= © мл A 


2 
X .01 


‚0002 
‚0201 
‚115 
‚297 


‚554 
‚872 


2 
X 005 


10. 
11. 
11. 
12. 
13. 


13. 
20. 
28. 
35. 


43. 
51. 
59. 
67. 


DD A a л A 


© 0 O o м4 


‚0000 
‚0100 
‚072 
‚207 


‚676 
‚989 


л © м) со 


„чм мю NP w 


ЧҮ 


F -分布 的 95% 的 下 侧 分 位 数 
(其 中 vi 为 分 子 自由 度 ,vy, 为 分 母 自 由 度 ) 


ЕЕЕ ЕЕЕ a- 


1| 161 | 200 | 216 | 225 | 230 | 234 | 237 | 239 | 241 | 242 | 244 | 246 | 248 | 249 | 250 251 | 252 | 253 | 254 





























2 |18.5 |19.0|19.2 19.4 19.4 |19.5119.5 





3 |10.1 [9.55 19.28 8.66 18.64 [8.62 


4 17.71 |6.9416.59 5.80 |5.77|5.75 











5 [6.61 (5.7915.41 4.82 4.56 14.53 4.50 4.37 
615.99 15.14|4.76 4.15 3.87 |3.84 3.81 3.67 
7 15.59 14.74 4.35 3.73 3.44 |3.41 3.38 3.23 
8 [5.32 14.4614.07 3.44 3.15 13.12 3.08 2.93 
9 15.12 14.2613.86 3.23 2.94 12.90 |2.86 2.71 
10 [4.96 |4.10|[3.71 3.07 2.77|2.74 2.70 2.54 
11 (4.84 13.983. 59 2.95 2.65 |2.61 [2.57 2.40 
12 [4.75 |3.89 3.49 2.85 2.5412.51 [2.47 2.30 
13 |4.6713.81|3.41 |3. 2.77 2.46 |2.42 |2.38 2.21 
14 14.60 |3.7413.34 2.70 2.3912.35 12.31 2.13 
15 |4.54 13.68 3.29 2.64 2.33 12.29(2.25 2.07 
16 14.49 /3.63 3.24 2.59 2.2812. 24 |2.19 2.01 
17 |4.45 [3.59 |3.20 2.55 2.23|2.19 12.15 1.96 
18 [4.41 [3.55 3.16 2.51 2.19[2.15 (2.11 1.92 
19 14.383. 52 [3.13 .48 2.16|2.11 (2.07 1.88 
20 14.35 [3.49 3.10 .45 2.12 {2.08 2.04 1.84 
21 |4.32 [3.47 13.07 ‚42 2.1012.05 2.01 1.81 
22 |4.30|3.4413.05 ‚40 .07|2.0311.98 1.78 
23 |4.28|3.42|3.03 2.37 .05|2.0111.96 1.76 
24 |4.26|3.40|3.01 ‚36 .03|1.9811.94 1.73 
25 |4.24|3.39|2.99 ‚34 .01|1.96|1.92 1.71 
26 14.2313.37|2.98 -32 ‚99|1.9511.90 1.69 
27 14.21|3.35|2.96 -3112 .97|1.9311.88 ‚67 
28 |4.20|3.34|2.95 29/2 .96\1.91|1.87 ‚65 
29!4.1813.33|2.93 .2812 -94|1.90|1.85 ‚64 
3014.1713.32|2.92 .27 |2 .93 |1.89 11.84 .62 
40 14.08 [3.23 2.84 .18 [2 .8411.7911.74 .51 
60 |4.00|3.15]2.76 .10 |2 75 |1.70|1.65 ‚39 
120 3.9213.07 2.68 .02|1 .66|1.61|1.55 .25 
ос |3.84,3.0012.60|2.37|2. . . .9411.8811. . 。 .57 1.52 |1.46 .00 


附录 М 


F -分布 的 99% 的 下 侧 分 位 数 
(其 中 v 为 分 子 自由 度 ,y, 为 分 母 自由 度 ) 














附录 证 


м МЮ {ёо ә ww wO ш wv  ь | 


b Юю мю N N 


b NY N N бы ш ә шә ә ы w ӊЫ эӊ „ „ә + 5 e ы Б e ha щл A см с^ © ~J ом 


Юю [Юю КЮ b бо ро 


„ч v w A A Ф A È A R e чл A A Сл л Сс с^ СМ см м оо ww 


w | шо W A ыу 


比例 部 分 


4 


5 


17 21 


15 
14 
13 
12 


11 
10 


л чл мл A С^ о © A мы ч м оо со о 


如 л д д дл 


19 
17 
16 
15 


л С с^ С се с^ с ч ы Y N ч © ж оо № 


л © © бо (Am 


л 


6 
25 
23 
21 
19 
18 


ч м ~ ы м о © с 有 мч 


с^ С © С AA «= 


© © с со 0 


~AN зз м м 的 


© |с œ % со чш 


© io oO © № 





6551 6599 













6646 6693 









6739 6785 









6830 6875 








6920 6964 










7007 7050 










7093 7135 






7177 7218 





7259 7300 








7340 7380 










7419 7459 









7497 






7536 






7574 7612 





7649 7686 








7723 7760 










7796 7832 









7868 






7903 






7938 7973 





8007 8041 









8075 8109 










8142 8176 










8209 






8241 






8274 8306 





8338 8370 










8401 8432 










8463 8494 










8525 






8555 






8585 8615 





8645 8675 










8704 8733 




















75 8762 8791 
76 8820 8848 
77 8876 8904 
78 8932 
79 8987 





м Мм |N 


„ч ә ©» | 


юм ою о мю „ ы 


比例 部 分 
4 5 
4 5 
4 5 
4 5 
4 4 
4 4 
3 4 
3 4 
3 4 
3 4 
3 4 
3 4 
3 4 

3 4 
3 4 
3 4 
3 4 
3 4 
3 3 
3 3 
3 3 
3 3 
3 3 
3 3 
3 3 
2 3 
2 3 
2 3 
2 3 
2 3 
2 3 
2 3 
2 3 
2 3 
2 3 
2 3 
4 5 


| 


„ы „„ „„ ы 


~] 


DD ©“ © “A 个 


оо оо © со 


м ч м бо о 








pæ 


ою >S o o 5 


比例 部 分 
4 5 
2 3 
2 3 
2 3 
2 3 
2 3 
2 3 
2 3 
2 2 
2 2 
2 2 
2 2 
2 2 
2 2 
2 2 
2 2 
2 2 
2 2 
2 2 
2 2 
2 2 
4 5 


W „ы e ә ia |& 


о ә шә шә ш 


D Ja WW „„ w ш 


шы ә» бш w ë 


„ „ш шо „ ш w ә »„ A A e È È A A jų 


ч jua „ „„ ә ыш 


t h h A h e > A A R e ь A A Rh |œ 


00 jw A A A A 


Ln 


e ù A A A > e A th thr nh h EA д 


O lIe e h A Б 


附录 顶 


е ЇЙ (0<4<1) 


А 0 1 2 3 4 5 6 7 8 9 

‚9512 ‚9418 ‚9324 ‚9231 ‚9139 
‚8607 ‚8521 ‚8437 ‚8353 ‚8270 
‚7788 ‚7711 ‚7634 ‚7558 ‚7483 
‚7047 -6977 ‚6907 ‚6839 -6771 
‚6376 ‚6313 ‚6250 ‚6188 ‚6126 


сос © © o с 
h ww N e.e D 


-5770 ‚5712 ‚5655 ‚5599 ‚5543 
‚5220 ‚5169 ‚5117 ‚5066 ‚5016 
‚4724 ‚4677 ‚4630 ‚48584 ‚4538 
‚4274 ‚4232 ‚4190 „4148 ‚4107 
‚3867 ‚3829 ‚3791 ‚3753 „3716 


(А 一 1, 2, 3， е, 10) 





> > > фо Фф 
O o м с t 


À 1 2 3 4 5 6 ， 7 8 9 10 
е^ 36788 .13534 .04979 .01832 .006738 .002479 .000912 .000335 .000123 .000045 


附录 有 区 


随机 数 表 





